Yayınlama öncesi kalite kontrol (QA), yıllar boyunca ağırlıklı olarak elle test senaryoları, sınırlı otomasyon ve dağınık hata raporu süreçlerinden oluştu. 2025 itibarıyla tablo kökten değişti: yapay zekâ (YZ) destekli testler, ürünün davranışını yalnızca “geçti/kaldı” şeklinde yargılamıyor; beklenen kullanıcı niyeti ile gerçek arayüz davranışıarasındaki boşluğu yorumlayabiliyor, görsel ve semantik farkları anlayabiliyor, performans/enerji anomalilerini çıkarabiliyor ve risk odaklı regresyon için akıllı örneklem oluşturabiliyor. Sonuç: Daha hızlı, daha kapsayıcı, daha öngörülebilir bir yayınlama öncesi kalite güvence döngüsü.
1) Neden YZ Destekli Test? Temel Mantık ve Kazanım Alanları
Klasik yaklaşımın açığı: Test planları çoğu zaman “özellik listesi” mantığıyla yazılır; kullanıcı niyeti, görsel anlaşılabilirlik, mikro metinler, erişilebilirlik veya enerji etkisi yeterince kapsanmaz.
YZ ile fark:
-
Algısal doğrulama: Ekranda “sonuç ekranı” gerçekten yeterince anlaşılıyor mu? Kontrast, hiyerarşi, mikro metin?
-
Semantik akış: “Kullanıcının hedefi” (niyet → sonuç) adım adım doğrulanabilir.
-
Anomali avı: Beklenmeyen gecikme, çerçeve takılması, pil çıkışı, ağ patlaması, çeviri kırılması vb. sinyaller modelle bulunur.
-
Risk odaklı regresyon: Kodu en çok etkileyen değişikliklere göre akıllı örneklem (test seçimi) yapılır.
Kazanımlar: Daha fazla hata yakalama, daha kısa döngü, daha yüksek yayın güveni ve inceleme riskinde düşüş.
2) Mimari: İnsan—YZ—Otomasyon Üçgeninde “HITL” Akışı
HITL (Human-in-the-Loop) kuralı:
-
YZ taslak senaryo ve görsel/semantik beklenti üretir.
-
İnsan test mühendisi risk ayarlarını yapar, “yasak ifadeler/kırmızı liste”yi tanımlar, yanlış pozitifleri ayıklar.
-
CI/CD hattı tetiklediğinde YZ çalıştırılır, anomali raporu üretir.
-
İnsan son söz sahibidir; “yayın bloklayıcı” kararını verir.
Kontrol listesi:
-
YZ çıktıları etiketli ve sürüm kontrollü mü?
-
Görsel/semantik orak (oracle) açıklanabilir mi?
-
Yanlış-pozitif yönetimi için geri bildirim döngüsü var mı?
3) Model Manzarası: Vizyon, Dil, Hibrit ve Anomali
Vizyon modelleri: Ekran görüntülerinde buton konumu, tipografi, kontrast, hizalama, “sonuç ekranı” varlığı, ikon standardı, marka yönergeleri.
Dil modelleri: Mikro metin, izin/Paywall kopyası, hata mesajı tonu, yerelleştirme tutarlılığı; kurallar defteri (altın ifade/kırmızı liste).
Hibrit: “Ekranda görülen” + “beklenen niyet” → semantik eşleşme (ör. “gün sonu raporu hazır” cümlesi var mı?).
Anomali modelleri: Soğuk başlatma, çerçeve/donma, ağ çağrısı deseni, pil sıcaklığı/akım; öğrenilmiş eşik ve değişim noktası tespiti.
Metrikler: Model precision/recall
, test geçiş oranı, yanlış-pozitif ve yanlış-negatif oranı.
4) Görsel Regresyon 2.0: Piksel Farkı Değil, Anlam Farkı
Sorun: Klasik piksel-diff çok gürültülü; ufak kaymalar yanlış alarm verir.
YZ çözümü:
-
Semantik bileşen çıkarımı: Başlık, CTA, ikon, form alanı, sonuç kartı.
-
Okunabilirlik ve hiyerarşi testi: Başlığın boyutu/kontrastı, CTA’nın görünürlüğü.
-
Densite ve hizalama: Sığ ekranlarda taşma/kesilme tespiti.
Kontrol listesi:
-
Her çekirdekte “sonuç ekranı” şablonu testleri
-
Kontrast (WCAG), font düşme (fallback) tespiti
-
RTL/LTR/çift dil (TR+EN) kırılmaları
5) Semantik Kullanım Vakası Testleri: Niyet → Sonuç Doğrulaması
Örnek akış:
-
Niyet: “Gün sonu raporumu hazırla.”
-
Adımlar: onboarding→izin (değer-sonrası)→çekirdek eylem→sonuç ekranı→paywall (gerekirse).
-
YZ, her adımda “amaç gerçekleşti mi?” diye kontrol eder; eksik ekran/bozuk metin/yanlış CTA tespit eder.
Metrikler: intent_success_rate
, step_retry_rate
, microcopy_clarity_score
.
6) Erişilebilirlik (A11y) Otomasyonu: Metin, Kontrast, Hareket
YZ rolleri:
-
Alt metin otomatik öneri + editör doğrulaması.
-
Kontrast/okunabilirlik raporu; dinamik yazı tipi büyümesinde taşma.
-
Hareket azalt aktifken animasyonların kapanması.
Kontrol listesi:
-
Büyük yazı tipi modunda kırılma var mı?
-
Kapalı altyazı/metin alternatifleri eksiksiz mi?
-
Ekran okuyucu sıralaması mantıklı mı?
7) Performans ve Enerji: Model Tabanlı Anomali Alarmı
Teknik:
-
p95 cold start, frame pacing, ANR/crash, network bytes/session, battery temp proxy izlenir.
-
YZ, geçmiş sürümlerle kıyaslayarak anomaliye bayrak koyar (örn. “p95 cold start %28 artış, 3. parti SDK başlatma gecikmesi”).
Kontrol listesi:
-
“Yayın bloklayıcı eşikler” tanımlı mı?
-
Üç sınıf cihaz matrisi (düşük/orta/üst) test edildi mi?
-
TV/10 ft UI, tablet ve zayıf bağlantı profilleri kapsandı mı?
8) Yerelleştirme ve “Vaat Uyumu” Testleri
YZ görevleri:
-
Pazar bazlı vaat dilinin (TR: erişilebilir ilk ay, DACH: iade güvencesi, ABD/UK: yıllık+deneme) metinlerde yer alıp almadığını doğrular.
-
Fiyat/plan ekranları; para birimi, tarih/saat formatı, metin taşmaları.
-
Görselde yerel ikonografi/metafor tutarlılığı.
Metrikler: localization_coverage
, market_promise_alignment
, currency_format_errors
.
9) İzin ve Paywall Akışları: “Değer-Sonrası” ve Güvence Dili
YZ kontrolleri:
-
İzin “değer-sonrası” mı tetikleniyor?
-
Paywall metninde sonuç + güven (iade/erişilebilir ilk ay/yıllık+deneme) vurgusu net mi?
-
Gölge metin/ince yazıyla riskli ifadeler var mı?
Kontrol listesi:
-
İzin “şimdi değil” yolu açık mı?
-
İade/iptal politikası kısa ve görünür mü?
-
Pazar başına 2–3 metin varyantı test edildi mi?
10) Deney/Feature Flag Uyum Testleri: Çakışma, Kilit, Geri Alma
Sorun: Birden çok deney aynı anda açıldığında beklenmedik kombinasyonlar.
YZ çözümü:
-
Bayrak kombinasyon grafı üzerinden riskli yolları hesaplattırın; yalnızca yüksek riskli kombinasyonları çalıştırın.
-
Kill switch testleri: Flag kapanınca akış stabil mi?
Metrikler: conflict_detection_rate
, rollback_success_time
, experiment_coverage
.
11) Mağaza İnceleme Riski: Politika—İddia—Görsel Gerçekliği
YZ denetimi:
-
Tıbbi/finansal iddialar için risk cümleleri, “mucize” dili, yasak kategoriler.
-
Görsel/video “gerçek ekran” vs fantezi mock ayrımı; yanıltıcı görsel uyarısı.
-
Yaş sınırlaması/ebeveyn metinleri.
Kontrol listesi:
-
“Kırmızı liste” ve “altın ifade” dosyaları güncel mi?
-
Bölgesel regülasyon uyumu ve telif/lisanslar doğrulandı mı?
-
“İddia → dayanak” link/ekran notu mevcut mu?
12) Güvenlik, Attestation ve Hile Önleme
YZ rolleri:
-
Attestation sinyallerini (Play Integrity/DeviceCheck) izler, anomali havuzu oluşturur.
-
Sahte trafik örüntülerini ve bilinen imzaları adresleyerek riskli oturumları işaretler.
-
Ödül ve rekabetçi modlarda kısıtlama kararının etkisini simüle eder.
Metrikler: risk_score_precision
, cheat_flag_rate
, false_positive_reverts
.
13) “Gri Kutu” Testler: Üretime Benzer Veriyle Niyet Doğrulama
Yaklaşım: Ne tamamen beyaz kutu (kod içi), ne de tamamen siyah kutu (UI üstü), gri kutu:
-
Anonimleştirilmiş üretim örnekleri ile NLU/niyet akışları test edilir.
-
Gerçek cihaz ve “zayıf ağ/uzun gecikme” profilleri taklit edilir.
-
Bulut bağımlılıkları mock/record-replay ile sınanır.
Kontrol listesi:
-
Gizlilik sınırları (PII maskeleme)
-
Sık karşılaşılan hata modelleri (timeout, 401, 429)
-
İyileştirme önerisi üreten YZ açıklaması
14) Erişilebilirlikte Kullanıcı Çalışmaları: YZ + İnsan Gölgelendirme
Model + panel:
-
YZ otomatik a11y rapor üretir;
-
Küçük bir kullanıcı paneli ile doğrulama yapılır (görme/işitme/motor farklılıklar).
-
YZ, panel geri bildiriminden öğrenerek sonraki sürümlerde hata oranını düşürür.
Metrikler: a11y_defect_density
, user_panel_agreement
, repeat_issue_rate
.
15) TV/Tablet/10 ft UI ve Sesli Arayüz Testleri
TV/10 ft UI:
-
Odak (focus) halkası, uzaktan kumanda/oyun kolu navigasyonu, poster okunabilirliği.
-
Paywall ve ebeveyn kapısı akışları.
Sesli arayüz:
-
intent_match_rate
,repair_rate
,WER
. -
“Sesle bul—ekranda tamamla” hibriti; sessiz saat ve gizlilik politikasının görünürlüğü.
16) PWA/TWA Testleri ve Core Web Vitals
YZ görevleri:
-
LCP/TBT/CLS anomali avı, Lighthouse trend analizi.
-
Web→App köprüsü: derin link/TWA yönlendirmeleri, oturum devamlılığı.
-
Web’deki metinlerin mağaza vaatleriyle tutarlılığı.
Metrikler: lcp_p75
, tbt_p75
, web_to_app_cr
.
17) Yorum—Tema Simülasyonu: Yayın Öncesi Geri Bildirim Öngörüsü
Fikir: YZ, önceki versiyon yorumlarını ve değişiklik setini okuyup hangi temalarda risk doğacağını öngörür (“ısınma”, “deneme iptali”, “anlaşılırlık”).
Uygulama: Sprint planına önleyici görevler ekleyin; sürüm notuna sayısal ifadeler hazırlayın.
Metrikler: predicted_complaint_alignment
, yayın sonrası tema isabeti.
18) Kriz Playbook’u: Regrasyon Yakalanırsa Ne Olur?
Prosedür:
-
Canary %5 → %25 → %100; anomali → rollback.
-
YZ, kök neden adaylarını sıralar (SDK, varlık, deney çakışması).
-
Kullanıcıya empatik duyuru ve kısa vadeli geçici çözüm.
Metrikler: MTTR
, puan toparlanması, negatif tema düşüşü.
19) Karar Defteri (ADR) ve Kalıcı Kurallar
ADR şablonu: Problem—Alternatif—Seçim—Gerekçe—Metrik—Sonuç.
Kalıcı kurallar örnekleri:
-
“İlk görsel = sonuç ekranı”;
-
“Değer-sonrası izin ve güvence dili”;
-
“TV/10 ft UI odak testleri zorunlu”;
-
“A11y raporu ve enerji hedefleri yayın bloklayıcı”.
20) 30–60–90 Günlük Uygulanabilir Plan
Gün 0–30 (Temel YZ Test Altyapısı)
-
Vizyon + dil modeli entegrasyonu, semantik görsel regresyon.
-
Telemetri sözlüğü ve Performans/Enerji anomali modeli.
-
A11y otomasyonu: kontrast, alt metin, büyük metin taşma raporları.
-
“Kırmızı liste / altın ifade” politika dosyaları.
Gün 31–60 (Derinleştirme ve Risk Odaklılık)
-
Niyet→sonuç semantik akış testleri; gri kutu veri seti.
-
Deney/flag kombinasyon grafı ve kill switch senaryoları.
-
PWA/TWA ve CWV testleri; yerelleştirme–vaat uyumu doğrulaması.
-
Yorum-tema öngörü modeli; sürüm notu şablonu (sayısal).
Gün 61–90 (Operasyonun Kurumsallaşması)
-
Test raporları → ADR; kalıcı QA kuralları.
-
Risk bazlı örneklem (değişim alanına göre test seçimi) ve cihaz matrisi.
-
Attestation + hile önleme simülasyonları.
-
Yayın bloklayıcı eşiklerin yönetimi; kriz playbook tatbikatı.
Sonuç
Yapay zekâ destekli test, yayınlama öncesi kalite kontrolü üç eksende yeniden tanımlar:
-
Algısal ve semantik doğrulama: Piksel farkı yerine anlam farkı aranır. “Sonuç ekranı”nın anlaşılır olup olmadığı, mikro metinlerin “güvence dili”, yerelleştirme—vaat uyumu ve erişilebilirlik, YZ ile ölçülebilir hale gelir. Bu, yalnızca hatayı bulmak değil, kullanıcı niyetini korumak demektir.
-
Performans–enerji–gizlilik birinci sınıf vatandaş olur: Soğuk başlatma, frame pacing, ağ/pil sinyalleri anomali modelleriyle izlenir; değer-sonrası izin ve politika uyumu otomatik denetlenir. Sonuç: Mağaza inceleme riskleri düşer, “ısınma/yavaşlık/yanıltıcı vaat” temaları yayımdan önce kesilir.
-
Öğrenen operasyon: Risk bazlı regresyon, deney/flag kombinasyon analizi, gri kutu testler ve ADR + kalıcı kurallar, QA’yı tek seferlik bir bariyer olmaktan çıkarıp sürekli gelişen bir sisteme dönüştürür. Kriz anında canary–rollback–empatik duyuru üçlüsü; YZ’nin kök neden önerileriyle birleşerek MTTR’yi düşürür.
Kısa sözün özü: “Anlamı test et, enerjiyi koru, riski akıllıca seç.” YZ destekli testler; yayınlamayı “dosya yüklemeye hazır mıyız?” sorusundan “kullanıcının niyeti ve mağaza ekosistemi için doğru sinyali veriyor muyuz?” sorusuna taşır. Bu zihniyetle kurulan QA, yalnızca hatayı daha fazla yakalamaz; puan, retansiyon ve LTV’yi doğrudan iyileştirir. Yayına giden yol artık daha kısa değil, daha akıllı.