Mimari, bölgesel CDN düğümlerinde Sunucusuz Fonksiyonlar kullanan bir Bulut-Yerel Kenar Hesaplama paradigması etrafında döner ve Federated Learning koordinatörleri ile birleşir. Kubernetes kümeleri, Knative ile ölçeklenebilirlik için model sunucu konteynerlerini yönetirken, TensorFlow Lite ve ONNX Runtime heterojen cihazlarda çıkarım işlemlerini yönetir. Mosquitto MQTT aracısı, asenkron cihaz iletişimini yönetir ve Apache Kafka akışları, federated eğitim turları için şifrelenmiş gradyan güncellemelerini toplar. Vault, model nesneleri için şifreleme anahtarlarını yöneterek kiracılar arasında Zero-Trust güvenlik sınırları sağlar.
Sorun Tanımı
Bir çok uluslu ödeme işleyici, dolandırıcılık tespit ML modellerini, güvenilir olmayan 4G/LTE bağlantısı olan gelişen pazarlardaki satıcı POS terminallerine ve tüketici akıllı telefonlarına doğrudan dağıtmak zorundaydı. Sistem, işlem zaman aşımını önlemek için 50 ms altında gerçek zamanlı çıkarım sağlama, uygulama güncellemeleri zorlamadan risk algoritmalarının A/B testlerine destek verme ve işlem verilerini cihazda saklayarak GDPR ve PCI-DSS ile sıkı uyum sağlama gereksinimlerini taşıyordu.
Çözüm 1: Merkezi Bulut Çıkarımı
Bu yaklaşım, tüm çıkarım taleplerini bölgesel AWS veri merkezlerine yönlendirdi ve Amazon SageMaker uç noktalarını kullandı.
Çözüm 2: Statik Cihaz İçi Modeller ile Periyodik Senkronizasyon
Bu strateji, dondurulmuş TensorFlow modellerini mobil uygulama ikili dosyaları içinde paketledi ve yalnızca üç aylık uygulama mağazası güncellemeleri ile güncellendi.
Çözüm 3: Federated Kenar Sunumu ile Delta Güncellemeleri
Seçilen mimari, Numara Cloudflare Workers kenar konumlarında Sunucusuz çıkarım işçileri kurarak, hafif ONNX modellerini HTTP/3 üzerinden sunuyordu. Cihazlar, bağlantı izin verdiğinde yalnızca farklı model deltasını indiriyordu. Federated toplama, ham verilerin cihazları asla terk etmediği Secure Aggregation protokolleri kullanılarak gerçekleşti.
Seçilen Çözüm ve Sonuç
Çözüm 3'ü seçtik çünkü bu, gecikme, gizlilik ve çeviklik açısından eşsiz bir denge sağladı. Uygulama, dolandırıcılıkla ilgili geri ödeme oranlarını altı ay içinde %42 azaltırken, bölgesel internet kesintileri sırasında %99.99'luk bir kullanılabilirlik sağladı. Federated yaklaşım, bulutta PII depolama maliyetlerini ortadan kaldırarak, uyum denetimi kapsamını %60 azaltmıştır.