Analistler için AI asistanları
1) Tanım ve değer
Analistler için AI asistanı, doğal dili doğru analitik eylemlere dönüştüren bir arayüzdür (sohbet, BI'da panel, IDE/SQL uzantısı, ses): SQL/DBT yazma, metrikleri açıklama, çizim yapma, anormallikleri arama, notlar oluşturma, deneysel planlar vb.
Değer: Sorudan içgörü için zamanı azaltmak, ekipler arasında uzmanlığı seviyelendirmek, kıdemli analistlerin yükünü azaltmak, dokümantasyonun kalitesini artırmak ve bilgiyi yeniden kullanmak.
2) Anahtar kullanım durumları
SQL copilot: sorgular oluşturma/optimize etme, yürütme planını açıklama, dizin ipuçları.
BI-copilot: widget'lar/gösterge tabloları oluşturma, grafiklere otomatik yorumlar ('ne değişti ve neden ").
Veri bulma: tabloları/metrikleri sözlük, bağlantı ve etkinliğe göre arayın.
Kalite ve gözlemlenebilirlik: veri testlerinin oluşumu, anomalilerin triyajı, düzeltmelerin önerisi.
Deneyler: A/B tasarımı, güç hesaplaması, sonuç analizi, metin raporları.
ML hızlandırma: taslak özellikleri/boru hatları, model karşılaştırması, izleme üretimi.
Dokümantasyon: Diyagramlardaki PR/difüzyonların özeti, vitrinler için otomatik README, kataloğa göre Q&A.
İletişim: analitik notların, özetlerin ve sunumların tasarımcısı.
3) Mimari desenler
1. RAG (Retrieval-Augmented Generation): LLM, vektör/karakter araması yoluyla çıkarılan kurumsal içeriğe (dizinler, şemalar, sözlük, SQL örnekleri) dayanarak yanıt verir.
2. Araç aracıları: LLM, işlev protokolünü kullanarak araçları (SQL yürütme, tablo profilleme, çizim, dbt dokümanları, Jira/GitHub, Slack) çağırır.
3. Korumalı yürütme: sanal alan, kaynak sınırları, tehlikeli istek politikası (DML yasaktır, yalnızca SELECT), bir kişiye yükseltme.
4. Semantik katman: Tekdüze iş metrikleri ve boyutları gerçeğin kaynağı olarak; Anlambilime göre SQL üretimi, ham tablolara göre değil.
5. Önbellek ve determinizm: istemlerin önbelleği (prompt + context), modellerin ve verilerin sürümlerinin sabitlenmesi, tekrarlanabilirlik kontrolü.
4) Entegrasyonlar ve gömme noktaları
DWH/OLAP: BigQuery, Snowflake, Redshift, ClickHouse; Salt okunur roller, RLS/CLS.
BI/dizüstü bilgisayarlar: Looker/Power BI/Tableau/Metabase, Jupyter/VS Kodu; uzantılar/botlar.
Kataloglar/soylar: DataHub/Amundsen/Collibra; tanımları ve sahipleri indeksleme.
Boru hatları: dbt/Hava akışı/Argo/Prefect; Testlerin, açıklamaların, sürüm notlarının oluşturulması.
İletişim: Slack/Teams/Jira/Confluence; İçgörülerin ve görevlerin otomatik yayınları.
5) Güvenlik, erişim ve uyumluluk
Kimlik Doğrulama/SSO: OIDC/SAML, gruplar ve roller için SCIM.
RLS/CLS: kiracı/rol/bölgeye göre filtreler; PII/PCI maskeleme.
Sorgu politikası: beyaz liste şemaları, zaman/çizgi sınırı, DDL/DML yasağı.
Denetim ve kayıt: kimin ne sorduğu, hangi verilerin görüntülendiği/dışa aktarıldığı.
RAG'da gizlilik: Yalnızca kurumsal belgelerin saklanması; Şifreleme; Özel veriler üzerinde dış eğitim yasağı.
Düzenleyici: günlük tutma, DSAR, doğru bölgelerde depolama lokalizasyonu.
6) UX kalıpları ve etkileşimi
Sohbet + Araçlar: eylem düğmeleriyle iletişim ("SQL'i başlat", "grafik oluştur", "kalite testi oluştur").
Açıklanabilirlik: Tanımların/SQL parçalarının alındığı kaynakları vurgulamak; Sözlük ve soy için bağlantılar.
Onayla ve Çalıştır: Ağır isteklerden önce çift onay, değer/zaman tahmini.
Birkaç çekim örneği: "Benzer sorguları/yönergeleri göster" düğmesi.
Mentor modu: Neden böyle bir plan/yöntem seçildiğine dair ayrıntılı açıklamalar.
Erişilebilirlik: klavye gezinmesi, tek tıklamayla snippet kopyalama, Markdown/PDF'ye dışa aktarma.
7) İstemi mühendisliği (temel şablonlar)
7. 1 Metrik açıklama
Task: Explain the <KPI> metric.
Output: definition, formula, table sources, owner, update window, caveats.
Format: short summary + markdown list.
Limitations: Rely only on the semantic layer and glossary.
7. Semantics tarafından 2 SQL Üretimi
Context: semantic objects {metric: "conversion_rate", dims: ["country, "" channel"], time: "day"}.
Task: generate SELECT for BigQuery, considering RLS by region.
Check: limit of 2000 lines, sorted by date, filter for the last 90 days.
7. 3 A/B Test Planı
Business question <description>.
Deduce: hypothesis, metrics (primary/guardrail), MDE, power calculation, duration,
stratification, analysis plan (CUPED/permutation), stopping criteria.
8) Kalitenin değerlendirilmesi (evals) ve halüsinasyonların kontrolü
SQL-evals: sonuçları referans sorgularla karşılaştırmak; denklik kontrolü (delta eşiği).
Doc-grounding: Asistan, yanıtta kullanılan belgelerin/metriklerin kimliğini belirtmelidir.
Linter kuralları: SQL stili, 'SELECT' yasağı, zorunlu zaman/kiracı filtreleri.
Negatif testler: kışkırtıcı talepler ("kişisel veri ver" - reddetme).
Kırmızı takım: düzenli güvenlik/gizlilik senaryoları.
9) Performans ve maliyet
Önbelleğe alma: sık tekrarlanan sorguların, gömmelerin, alınan parçaların sonuçları.
Belirteç azaltma: kısa sistem istemleri, agresif ilgili örnekleme.
Havuzlara katılın ve ön hesaplama yapın: Popüler sorular için materyalize edilmiş vitrinler.
Bütçe koruyucuları: Kullanıcı/ekip başına kotalar, içgörü maliyeti raporu.
10) MLOps ve çalışma
Sürüm oluşturma: modeller, istemler, araçlar, RAG indeksleri - sürüm numaraları ve changelog ile.
İzleme: gecikme, hatalar, yanıtların kaynaklarla paylaşımı, manuel SQL düzenlemelerinin sıklığı.
Olaylar: folback modu (bağlantılarla güvenli yanıtlar), istemlerin/modellerin hızlı geri alınması.
Bültenler: kanarya hesaplamaları; Karşılaştırma'eski asistan vs yeni "iş metrikleri ile.
Personel eğitimi: güvenli talepler, anti-kalıplar, etik için rehber.
11) Yardımcı Başarı Metrikleri
Benimseme: MAU/WAU, aktif analistlerin payı, yeniden kullanım.
Hız: SQL/grafik/yanıtı düzeltmek için medyan zaman.
Kalite: düzenlemesiz yanıtların paylaşımı, eval setlerde doğruluk, kaynaklara bağlantılar içeren kapsama.
Ekonomi: içgörü/istek başına maliyet, insan-saat tasarrufu.
İş etkisi: Rapor yayınlarının hızının yükseltilmesi, analizlerde SLA ihlallerinin azaltılması.
12) Antipatterns
Veri yerine sohbet: anlamsal katman ve sözlük eksikliği - metriklerde kaos.
Sınırsız haklar: RLS/CLS ve denetim olmadan satışlara yardımcı erişim.
Topraklama olmadan halüsinasyonlar: Referanslar ve doğrulanabilir kaynaklar olmadan yanıtlar.
Evallerin yokluğu: "gözle" serbest bırakma, olaylarda artış.
Tek kiracı istemleri: şemalara sabit kablolu yollar - hareket ederken ağrı.
Yalnızca iframe-embedding: araçları çağıramama ve eylemler yapamama.
13) Uygulama Yol Haritası
1. Keşif: Analist görevlerinin listesi, doğruluk kaynakları (anlambilim/sözlük), riskler.
2. MVP: chat + SQL generation in 3-5 showcases, read-only access, RAG by glossary, basic evals.
3. Ölçek: araç aracıları (BI, dbt, Jira), örnek katalog, açıklanabilirlik, denetim.
4. Sertleşme: negatif testler, kırmızı takım, bütçe muhafızları, kütüklerin ve DSAR'ın retansiyonları.
5. Büyüme: role göre kişiselleştirme, otomatik uyarılar/öneriler, ses arayüzü, harici ortaklar.
14) Yayın öncesi kontrol listesi
- Bağlı SSO, roller/gruplar, RLS/CLS ve PII maskeleme.
- Anlamsal katman ve sözlük kapak MVP KPI, sahipleri vardır.
- Sorgular şema/kota kısıtlıdır, DML/DDL'ye izin verilmez.
- Evals: SQL referans/yanıt kümesi, kalite eşikleri ve uyarılar.
- Günlükler ve denetim etkin; Olay planı ve folback modu hazır.
- UX: ağır işlem onayı, yanıtlardaki kaynaklar, Markdown/PDF'ye dışa aktarma.
- Kullanıcı belgeleri: Hızlı kılavuz, anti-kalıplar, örnekler.
15) Asistan için "canlı" istemlerin örnekleri
"TR bölgesi için 90 günlük dönüşüm çizelgelerini bulun, formülleri açıklayın".
"SQL: p95 gecikmesini X servisine göre üretin, güne göre, prod trafiğine göre filtreleyin, 2k satıra kadar".
"ARPPU'yu kanalla çizin, anomalileri açıklayın, 5 tezde bir sonuç çıkarın".
"Yeni bonus mekaniği için bir A/B planı yapın: metrikler, MDE, güç, korkuluklar".
"Ödemeler vitrini için kalite testleri oluşturun: tazelik ≤ 30 dakika, benzersizlik" txn_id.
Alt satır: Analistler için AI asistanları akıllı sohbet değil, yönetilen bir bilgi ve araç platformudur. Değerleri, semantik bir katman, sıkı erişimler, eval-process ve çalışma araçlarına entegrasyon olduğunda ortaya çıkar. Sonra asistan gerçekten içgörü için zaman azaltır ve çözümlerin kalitesini artırır.