Analistler için AI asistanları

1) Tanım ve değer

Analistler için AI asistanı, doğal dili doğru analitik eylemlere dönüştüren bir arayüzdür (sohbet, BI'da panel, IDE/SQL uzantısı, ses): SQL/DBT yazma, metrikleri açıklama, çizim yapma, anormallikleri arama, notlar oluşturma, deneysel planlar vb.
Değer: Sorudan içgörü için zamanı azaltmak, ekipler arasında uzmanlığı seviyelendirmek, kıdemli analistlerin yükünü azaltmak, dokümantasyonun kalitesini artırmak ve bilgiyi yeniden kullanmak.

2) Anahtar kullanım durumları

SQL copilot: sorgular oluşturma/optimize etme, yürütme planını açıklama, dizin ipuçları.
BI-copilot: widget'lar/gösterge tabloları oluşturma, grafiklere otomatik yorumlar ('ne değişti ve neden ").
Veri bulma: tabloları/metrikleri sözlük, bağlantı ve etkinliğe göre arayın.
Kalite ve gözlemlenebilirlik: veri testlerinin oluşumu, anomalilerin triyajı, düzeltmelerin önerisi.
Deneyler: A/B tasarımı, güç hesaplaması, sonuç analizi, metin raporları.
ML hızlandırma: taslak özellikleri/boru hatları, model karşılaştırması, izleme üretimi.
Dokümantasyon: Diyagramlardaki PR/difüzyonların özeti, vitrinler için otomatik README, kataloğa göre Q&A.
İletişim: analitik notların, özetlerin ve sunumların tasarımcısı.

3) Mimari desenler

1. RAG (Retrieval-Augmented Generation): LLM, vektör/karakter araması yoluyla çıkarılan kurumsal içeriğe (dizinler, şemalar, sözlük, SQL örnekleri) dayanarak yanıt verir.
2. Araç aracıları: LLM, işlev protokolünü kullanarak araçları (SQL yürütme, tablo profilleme, çizim, dbt dokümanları, Jira/GitHub, Slack) çağırır.
3. Korumalı yürütme: sanal alan, kaynak sınırları, tehlikeli istek politikası (DML yasaktır, yalnızca SELECT), bir kişiye yükseltme.
4. Semantik katman: Tekdüze iş metrikleri ve boyutları gerçeğin kaynağı olarak; Anlambilime göre SQL üretimi, ham tablolara göre değil.
5. Önbellek ve determinizm: istemlerin önbelleği (prompt + context), modellerin ve verilerin sürümlerinin sabitlenmesi, tekrarlanabilirlik kontrolü.

4) Entegrasyonlar ve gömme noktaları

DWH/OLAP: BigQuery, Snowflake, Redshift, ClickHouse; Salt okunur roller, RLS/CLS.
BI/dizüstü bilgisayarlar: Looker/Power BI/Tableau/Metabase, Jupyter/VS Kodu; uzantılar/botlar.
Kataloglar/soylar: DataHub/Amundsen/Collibra; tanımları ve sahipleri indeksleme.
Boru hatları: dbt/Hava akışı/Argo/Prefect; Testlerin, açıklamaların, sürüm notlarının oluşturulması.
İletişim: Slack/Teams/Jira/Confluence; İçgörülerin ve görevlerin otomatik yayınları.

5) Güvenlik, erişim ve uyumluluk

Kimlik Doğrulama/SSO: OIDC/SAML, gruplar ve roller için SCIM.
RLS/CLS: kiracı/rol/bölgeye göre filtreler; PII/PCI maskeleme.
Sorgu politikası: beyaz liste şemaları, zaman/çizgi sınırı, DDL/DML yasağı.
Denetim ve kayıt: kimin ne sorduğu, hangi verilerin görüntülendiği/dışa aktarıldığı.
RAG'da gizlilik: Yalnızca kurumsal belgelerin saklanması; Şifreleme; Özel veriler üzerinde dış eğitim yasağı.
Düzenleyici: günlük tutma, DSAR, doğru bölgelerde depolama lokalizasyonu.

6) UX kalıpları ve etkileşimi

Sohbet + Araçlar: eylem düğmeleriyle iletişim ("SQL'i başlat", "grafik oluştur", "kalite testi oluştur").
Açıklanabilirlik: Tanımların/SQL parçalarının alındığı kaynakları vurgulamak; Sözlük ve soy için bağlantılar.
Onayla ve Çalıştır: Ağır isteklerden önce çift onay, değer/zaman tahmini.
Birkaç çekim örneği: "Benzer sorguları/yönergeleri göster" düğmesi.
Mentor modu: Neden böyle bir plan/yöntem seçildiğine dair ayrıntılı açıklamalar.
Erişilebilirlik: klavye gezinmesi, tek tıklamayla snippet kopyalama, Markdown/PDF'ye dışa aktarma.

7) İstemi mühendisliği (temel şablonlar)

7. 1 Metrik açıklama


Task: Explain the <KPI> metric.
Output: definition, formula, table sources, owner, update window, caveats.
Format: short summary + markdown list.
Limitations: Rely only on the semantic layer and glossary.

7. Semantics tarafından 2 SQL Üretimi


Context: semantic objects {metric: "conversion_rate", dims: ["country, "" channel"], time: "day"}.
Task: generate SELECT for BigQuery, considering RLS by region.
Check: limit of 2000 lines, sorted by date, filter for the last 90 days.

7. 3 A/B Test Planı


Business question <description>.
Deduce: hypothesis, metrics (primary/guardrail), MDE, power calculation, duration,
stratification, analysis plan (CUPED/permutation), stopping criteria.

8) Kalitenin değerlendirilmesi (evals) ve halüsinasyonların kontrolü

SQL-evals: sonuçları referans sorgularla karşılaştırmak; denklik kontrolü (delta eşiği).
Doc-grounding: Asistan, yanıtta kullanılan belgelerin/metriklerin kimliğini belirtmelidir.
Linter kuralları: SQL stili, 'SELECT' yasağı, zorunlu zaman/kiracı filtreleri.
Negatif testler: kışkırtıcı talepler ("kişisel veri ver" - reddetme).
Kırmızı takım: düzenli güvenlik/gizlilik senaryoları.

9) Performans ve maliyet

Önbelleğe alma: sık tekrarlanan sorguların, gömmelerin, alınan parçaların sonuçları.
Belirteç azaltma: kısa sistem istemleri, agresif ilgili örnekleme.
Havuzlara katılın ve ön hesaplama yapın: Popüler sorular için materyalize edilmiş vitrinler.
Bütçe koruyucuları: Kullanıcı/ekip başına kotalar, içgörü maliyeti raporu.

10) MLOps ve çalışma

Sürüm oluşturma: modeller, istemler, araçlar, RAG indeksleri - sürüm numaraları ve changelog ile.
İzleme: gecikme, hatalar, yanıtların kaynaklarla paylaşımı, manuel SQL düzenlemelerinin sıklığı.
Olaylar: folback modu (bağlantılarla güvenli yanıtlar), istemlerin/modellerin hızlı geri alınması.
Bültenler: kanarya hesaplamaları; Karşılaştırma'eski asistan vs yeni "iş metrikleri ile.
Personel eğitimi: güvenli talepler, anti-kalıplar, etik için rehber.

11) Yardımcı Başarı Metrikleri

Benimseme: MAU/WAU, aktif analistlerin payı, yeniden kullanım.
Hız: SQL/grafik/yanıtı düzeltmek için medyan zaman.
Kalite: düzenlemesiz yanıtların paylaşımı, eval setlerde doğruluk, kaynaklara bağlantılar içeren kapsama.
Ekonomi: içgörü/istek başına maliyet, insan-saat tasarrufu.
İş etkisi: Rapor yayınlarının hızının yükseltilmesi, analizlerde SLA ihlallerinin azaltılması.

12) Antipatterns

Veri yerine sohbet: anlamsal katman ve sözlük eksikliği - metriklerde kaos.
Sınırsız haklar: RLS/CLS ve denetim olmadan satışlara yardımcı erişim.
Topraklama olmadan halüsinasyonlar: Referanslar ve doğrulanabilir kaynaklar olmadan yanıtlar.
Evallerin yokluğu: "gözle" serbest bırakma, olaylarda artış.
Tek kiracı istemleri: şemalara sabit kablolu yollar - hareket ederken ağrı.
Yalnızca iframe-embedding: araçları çağıramama ve eylemler yapamama.

13) Uygulama Yol Haritası

1. Keşif: Analist görevlerinin listesi, doğruluk kaynakları (anlambilim/sözlük), riskler.
2. MVP: chat + SQL generation in 3-5 showcases, read-only access, RAG by glossary, basic evals.
3. Ölçek: araç aracıları (BI, dbt, Jira), örnek katalog, açıklanabilirlik, denetim.
4. Sertleşme: negatif testler, kırmızı takım, bütçe muhafızları, kütüklerin ve DSAR'ın retansiyonları.
5. Büyüme: role göre kişiselleştirme, otomatik uyarılar/öneriler, ses arayüzü, harici ortaklar.

14) Yayın öncesi kontrol listesi

Bağlı SSO, roller/gruplar, RLS/CLS ve PII maskeleme.
Anlamsal katman ve sözlük kapak MVP KPI, sahipleri vardır.
Sorgular şema/kota kısıtlıdır, DML/DDL'ye izin verilmez.
Evals: SQL referans/yanıt kümesi, kalite eşikleri ve uyarılar.
Günlükler ve denetim etkin; Olay planı ve folback modu hazır.
UX: ağır işlem onayı, yanıtlardaki kaynaklar, Markdown/PDF'ye dışa aktarma.
Kullanıcı belgeleri: Hızlı kılavuz, anti-kalıplar, örnekler.

15) Asistan için "canlı" istemlerin örnekleri

"TR bölgesi için 90 günlük dönüşüm çizelgelerini bulun, formülleri açıklayın".
"SQL: p95 gecikmesini X servisine göre üretin, güne göre, prod trafiğine göre filtreleyin, 2k satıra kadar".
"ARPPU'yu kanalla çizin, anomalileri açıklayın, 5 tezde bir sonuç çıkarın".
"Yeni bonus mekaniği için bir A/B planı yapın: metrikler, MDE, güç, korkuluklar".
"Ödemeler vitrini için kalite testleri oluşturun: tazelik ≤ 30 dakika, benzersizlik" txn_id.

Alt satır: Analistler için AI asistanları akıllı sohbet değil, yönetilen bir bilgi ve araç platformudur. Değerleri, semantik bir katman, sıkı erişimler, eval-process ve çalışma araçlarına entegrasyon olduğunda ortaya çıkar. Sonra asistan gerçekten içgörü için zaman azaltır ve çözümlerin kalitesini artırır.

Analistler için AI asistanları

Bizimle iletişime geçin

Hızlı iletişim

Video yakında güncellenecek

Şu anda projelerle çok meşgulüz