Soruya Yanıt

Tarihi bağlam, şirketlerin veri işleme için kullanıcıların açık rızasını istemelerini zorunlu kılan gizlilik düzenlemelerinin evrimi ile şekillenmektedir (GDPR, CCPA, ePrivacy Directive). 2018'den önce analistler, kullanıcı yolculuğunu tam olarak izleyen deterministik atıf üzerinde yoğunlaşmışlardı, fakat onay yönetim platformlarının (CMP) uygulanması, verilerin sistematik olarak kaybolmasına (missing not at random) yol açarak hunileri ve LTV metriklerini çarpıttı.

Sorun, endojenite self-selection'dadır: çerezleri reddeden kullanıcılar, davranışları açısından sistematik olarak farklıdır (daha yüksek fiyat hassasiyeti, reklam engelleyicilerin kullanımı, reklamlara daha az tıklama) ve bu da gözlemlenen verilerde bir hayatta kalma yanlılığı (survival bias) yaratmaktadır. Rıza gösteren ve göstermeyen koro grup karşılaştırması, “kaybolan” kullanıcıların rastgele bir örneklem olmadığı için kanal verimliliğini aşırı değerlendirir.

Çözüm, nedensel çıkarım üzerine kuruludur; enstrümantasyon değişkenleri (IV) veya onay eğilimi için eşik değere dayalı regresyon kesinti tasarımı (RDD) kullanılır. Burada, two-stage least squares (2SLS) yönteminde araç olarak CMP-banner tasarımı (örneğin, «Kabul Et» butonunun konumu) kullanılır; bu, rıza olasılığını etkiler ancak doğrudan dönüşüm ile korele değildir. Uzun dönem etkisinin değerlendirilmesinde, Sentetik Kontrol Yöntemi uygulanır; bu, yüksek onay oranına sahip bölgeler veya segmentlerin ağırlıklı bir kombinasyonunu kullanarak, sıkı rıza olmaksızın karşıfaktüel senaryonun modellemesini sağlar. Ayrıca, first-party data ve server-side tracking temelinde olasılıklı atıf uygulanır; bu, «kaybolan» zincirlerin bir kısmını Markov zincirleri veya Shapley değeri gibi olasılık modelleri ile yeniden oluşturmayı sağlar.

Gerçek Hayat Durumu

Bir e-ticaret platformu, EU bölgesinde GDPR uyumlu onay bannerının uygulanmasının ardından bir krizle karşılaştı: izlemeyi reddeden kullanıcıların oranı %60'a ulaştı ve gözlemlenen dönüşüm oranı %35 oranında düştü. İşletme, pazarlama verimliliğinde felaket bir düşüş öngörüyordu, ancak gerçek talep azalmasını atıf veri kaybı artefaktından ayırmak gerekiyordu.

İlk düşünülen seçenek, uygulamadan önceki ve sonraki metriklerin basit karşılaştırmasıdır (pre-post analizi). Artıları: anında uygulanabilirlik ve anlaşılır yorumlama. Eksileri: mevsimselliğin tamamen görmezden gelinmesi (uygulama yaz ayı düşüşü ile aynı zamana denk geldi), dış rekabetçi kampanyalar ve iOS Uygulama İzleme Şeffaflığı algoritmalarındaki değişiklikler, sonucu geçersiz kılıyordu.

İkinci seçenek, AB trafiğini AB dışındaki ülkelerin trafiği ile karşılaştırmaktı (coğrafi deney). Artıları: tam izlemeye sahip bir kontrol grubunun varlığı. Eksileri: farklı bölgelerin müşteri davranışlarındaki farklılıklar, döviz dalgalanmaları ve piyasa gelişiminin farklı aşamaları nedeniyle temel karşılaştırılamazlık, değerlendirmenin %15-20 oranında kaymasına neden olabilirdi.

Üçüncü seçenek, CausalImpact uygulaması, Bayesyen yapısal zaman serisi modeli kullanarak uygulanır. Artıları: zaman bağımlılıkları ve mevsimselliği dikkate alması. Eksileri: kovariyat (predictor) seçiminde hassasiyet ve senkronize şokların olmaması varsayımına olan duyarlılık, bu da küresel gizlilik politikası değişimlerinin olduğu bir dönemde riskli olabilir.

Seçilen çözüm, Sentetik Kontrol Yöntemi (SCM) kullanarak yüksek tarihi rıza oranına sahip kullanıcı segmentlerini (donörler) kullanarak ağırlıklı sentetik bir AB oluşturmak oldu. Ayrıca, koro düzeyinde enstrümantasyon değişkenleri uyguladık: banner tasarımının (buton rengi, varsayılan) rasgeleleştirilmiş A/B testlerini Yerel Ortalama Tedavi Etkisi (LATE) değerlendirmesi için araç olarak kullandık. Bu, verilerin varlığından, banner tasarımından bağımsız olan temiz etkiyi izole etmeyi sağladı.

Sonuç, gerçek dönüşümdeki düşüşün sadece %8 (veya %35 değil) olduğunu gösterdi, geri kalan ise atıf kaybı artefaktıydı. MTA (Çoklu Temas Atıf) modeli, artıklık-temelli kalibrasyon kullanılarak yeniden yapılandırıldı; bu da ROAS tahmin doğruluğunu onay öncesi değerlerin ±%3 seviyesinde geri kazandırdı.

Adayların Sıklıkla Gözden Kaçırdığı Noktalar

Tam rızası olmayan kullanıcıların (yalnızca gerekli çerezler) analizden dışlanmasıyla atıf yanlılığını nasıl ayarlarsınız?

Adaylar genellikle izinsiz kullanıcıları analize dahil etmemeyi önerir, bu da seçim yanlılığını artırır. Doğru yaklaşım, pattern-mixture models veya multiple imputation by chained equations (MICE) kullanımını içerir ve kaçırma mekanizmasını (MNAR) dikkate alır. Rıza olmadan bile, gözlemlenen davranış sinyalleri (first-party events) üzerinde dönüşüm olasılığını modellemek gereklidir ve third-party identifiers yokluğunda olasılıksal çıktılar (surrogate outcomes) kullanmak, nedensel tahminleri yeniden oluşturmak için yararlı olabilir.

Neden standart tıklama oranları (CTR) sıkı rıza uygulandıktan sonra artış gösterir ve bunu nasıl yorumlarsınız?

Bu klasik bir hayatta kalma yanlılığıdır: yalnızca izlemeye rıza veren yüksek motivasyonlu kullanıcılar kalır ve bu kullanıcılar zaten yüksek CTR'ye sahip olmuştur. Adaylar, tek başına per-protocol grubunda değil, tüm nüfus üzerinde tedavi etme niyeti (ITT) etkisinin değerlendirilmesine ihtiyaç olduğunu gözden kaçırır. Cumpliyer Ortalama Nedensel Etkisi (CACE) analizini, rıza banner tasarımını bir etki değerlendirme aracı olarak kullanarak uygulamak gerekir.

Veri kaybının etkisini gerçek talep azalmasından nasıl ayırırsınız, hukuken onaysız bir kontrol grubu oluşturma imkanı olmadığında?

Burada, farklar içerisindeki farklar (DiD) ve aşamalı benimseme tasarımının uygulanması kritik öneme sahiptir veya sentetik kontrol ile farklı yargılardaki “erken” ve “geç” benimseyicilerin kullanımı gerekir. Adaylar sık sık eş zamanlı eğilim varsayımını dikkate almaz; bu, event study spesifikasyonları üzerinden geçerli hale getirilmelidir. Ayrıca, iç metrikleri doğrulamak için proxy değişkenleri (örneğin, toplu kredi kartı harcama verileri veya tedarikçilerden panel verileri) alternatif bir gerçeklik kaynağı olarak kullanılmalıdır; bu da differential privacy gürültüsüne göre ayarlama yapar.