KI-Visualisierung von Metriken
1) Was ist KI-Visualisierung
Die KI-Visualisierung von Metriken ist eine Kontur, bei der Modelle (ML/LLM) automatisch:1. Auswahl des geeigneten Diagramm- und Achsentyps,
2. Muster/Anomalien/Trendbrüche hervorheben,
3. einen erklärbaren Text formulieren (insight/narrative),
4. Maßnahmen vorschlagen (Next Best Action),
5. Passen Sie die Ansicht an den Kontext des Benutzers und des Geräts an.
Ziel ist es, den Weg von der Frage zur Antwort zu verkürzen: weniger manuelle Chartauswahl, mehr überprüfbare Bedeutungen.
2) Architektur in der Handfläche
1. Semantic Layer: einheitliche Definitionen von Metriken/Dimensionen (Glossar, Formeln, Aggregationen, Zugriffe).
2. NL→Query: Konvertieren einer natürlichen Sprachabfrage in SQL/SPARQL/DSL.
3. Query→Viz: Automatische Anpassung der Grammatik des Graphen und der Parameter (Achsen, Log-Skalen, Farbe/Form/Größe).
4. Insight Engine: Anomaliedetektion, Breakpoints, Saisonalität, causale Hinweise; Prioritäten der Signale.
5. Narrativ: Generieren von Faktencheck-Text mit Bezug auf Werte und Konfidenzintervalle.
6. RAG: Mischen des Kontextes aus dem Daten-/Konfigurationskatalog (Metadaten, Geschäftsregeln).
7. Politik Guardrails: Datenschutz/Zugang/Maskierung, Verifizierung von Zahlen und Links.
8. Lieferung: Web-Widgets, mobile Karten, PDF/Snap-Shots, Webhooks in CRM/Slack.
3) Graphen Grammatik und Auto-Matching
Grundsätze:- Zeit → Linie/Bereich; Kategorien (≤8) → Spalten/Kacheln; Ranking → Bar/Leaderboard; Verteilung → Histogramm/Violin/Box; Korrelation → Scatter/Heatmap.
- Log-Achse bei exponentiellem Wachstum; Normierung (%) bei Bruchteilen; small multiples - wenn es viele Serien gibt.
- Farbauswahl: semantische Paletten für Status; Farbe ≠ gleichzeitig ein Kanal von Ordnung und Kategorie.
- Unterschriften nur dort, wo sie Sinn machen: Wir minimieren die „Tinte“.
yaml chart:
mark: line encoding:
x: {field: dt, type: temporal, timeUnit: day}
y: {field: ggr, type: quantitative, aggregate: sum}
color: {field: region, type: nominal, legend: top, limit: 6}
transforms:
- filter: "dt >= now()-90d"
- calculate: {expr: "rolling_mean(ggr,7)", as: "ggr_7d"}
annotations:
- rule: {type: "changepoint", method: "cusum"}
- band: {type: "confidence", metric: "ggr", level: 0.9}
interactions: {tooltip: true, zoom: "x", brush: "x"}
4) NL→Viz: von der Frage zum Zeitplan
Parsing Absichten: Metrik, Schnitte, Periode, Filter, Aggregate.
Validierung auf semantischer Ebene: nur zulässige Felder/Formeln.
Post-Processing: Chart-Auswahl nach Feldtypen und Kardinalität, Auto-Schwelle Bining/Sampling.
Feedback: Zeige SQL/DSL und Download von Daten (maskiert), um Vertrauen aufzubauen.
yaml ask: "Покажи GGR по странам за 90 дней, выдели резкие изменения"
metric: ggr dims: [country, dt]
filters: {dt: "last_90d"}
viz_hint: "line + changepoints"
5) Insight Engine: Wie man „Bedeutungen“ generiert
Signale:- Anomalien: STL-Zerlegung, ESD/Prophet, BOCPD; Wir markieren die Richtung/den Betrag/das Vertrauen.
- Trendbrüche: CUSUM/Chow-Test; Lokale Regressionen.
- Saisonalität/Kampagnen: Vergleich „Urlaub vs normaler Tag“, uplift zu baseline.
- Segment-Treiber: Shapley/Feature-Importance über Tabellenregression oder Gradient-Boost.
- Kausale Hinweise: Angabe begleitender Veränderungen (im Rahmen der Beobachtung) + Erinnerung „das ist eine Korrelation“.
1. Auswirkungen auf die Geschäftsmetrik, 2) Stärke des Effekts, 3) Neuheit, 4) Vertrauen.
6) Erzeugung einer Erzählung (Text)
Voraussetzungen: Fakten mit Zahlen und Daten, Angabe der Vergleichsbasis, Genauigkeit der Begriffe.
Vorlage:7) Anpassung an den Kontext (Personalisierung)
Rollen: C-Level - KPI-Karten und Narrative; Manager - Schnitte und Alerts; Analysen - SQL/DSL und Modellparameter.
Gerät: kompakte Sparklines auf dem Handy, Full Viz auf dem Desktop.
Geo/Sprache/Währung/Zeitzone - automatisch.
8) Erklärbarkeit und Vertrauen
Jede Signatur auf dem Diagramm ist anklickbar → zeigt die Berechnung (Formel, Aggregationen, Filter).
Wir geben die statistische Unsicherheit (Vertrauensbänder, Fehlerbalken) an.
Für LLM-Beschreibungen: RAG nach Metadaten, Abgleich der Zahlen nach Quelle (Überprüfung der Summen/Bereiche).
Änderungsprotokoll: Version von Formeln, Datasets, Charts.
9) Qualität und SLO-Visualisierung
Latency p95 rendering, time-to-first-insight, Anteil erfolgreicher NL-Abfragen.
Explainability score (Vorhandensein von Zahlen/Referenzen/CI im Narrativ).
Accuracy NL→SQL (ex. exact-match auf Referenzabfragen).
Zugänglichkeit: Kontrast, Alt-Text, Tastatur, Farbenblindheit.
10) Verfügbarkeit (A11y) und UX-Muster
Farbpaletten, unabhängig von der Farbwahrnehmung; Farbform/Muster duplizieren.
Textalternativen und Data-Table-Ansicht neben dem Diagramm.
Fokusfallen, vernünftige Tab-Reihenfolge; Skalieren, ohne die Achsen zu brechen.
11) Sicherheit und Privatsphäre
RLS/CLS auf Abfrage- und Datenebene tooltips.
Masking/Bining für seltene Kategorien, um Re-Identification zu vermeiden.
NL-Fragen Zeitschriften - PDn-Safe: Tokenisierung/Überarbeitung potenzieller PIIs.
Export von Screenshots/CSV - mit Wasserzeichen und Metadaten der Version.
12) Wirtschaft und Kosten
Cost-aware: Caching von Caches/Ergebnissen, Materialisierung von „heißen“ Schaufenstern, Sampling für die Vorschau.
Begrenzung von „schweren“ NL-Abfragen (Scan Caps), verzögertes Rendern für große Serien.
Günstige Modelle für die Basisdetektion + schwere Offline-Auswertungen in der Nacht.
13) Antipatterns
„Auto-Charts haben immer Recht“. Wir brauchen eine Validierung der Typen/Kardinalitäten/Logik der Metriken.
Too much ink. Komplexe 3D/dual-axis ohne → Verzerrung.
Ohne Angabe von Unsicherheit. Die Texte klingen „kategorisch“, sind aber irreführend.
NL→SQL ohne semantische Ebene. Fragilität und Aggregationsfehler.
Magische Einblicke ohne Bezug zu Zahlen. Misstrauen und Ablehnung des Instruments.
14) Fahrplan für die Umsetzung
1. Foundation: Semantische Ebene, Metrik-Glossar, Zugriffe (RLS/CLS), NL→SQL-Testkits.
2. MVP NL→Viz: Top-10-Fragen, Auto-Charts zur Grammatik, Validierung von Typen/Kardinalitäten.
3. Insight Engine: Anomalien/Breakpoints, Prioritäten, grundlegende Narrative mit CI.
4. RAG & Trust: Metadaten/Formeln, Evidence Log in UI einbinden.
5. A11y und Mobile: adaptive Karten, Alt-Texte, Kontrast/Tastatur.
6. FinOps: Caches/Materialisierungen, Scanlimits, Lastprofile.
7. Scale: Personalisierung nach Rolle, Szenario NLG Vorlagen, Integration in CRM/Warnungen.
15) Checkliste vor Veröffentlichung
- Metriken und Dimensionen werden in der semantischen Schicht beschrieben; SELECT ist nicht zulässig.
- Auto-Chart-Matching wird nach Typ/Kardinalität/Regeln validiert.
- Narrative enthalten Zahlen, Vergleich, Basis und Vertrauensbereich.
- Unsicherheits-/Error-Bars enthalten (falls zutreffend).
- NL→SQL/DSL die Benchmarks bestehen; SQL-Ansicht für den Benutzer sichtbar.
- RLS/CLS und Masking funktionieren in Tooltips/Exporten.
- A11y: Kontrast, Alt-Texte, Tab-Navigation, Farbenblindheit.
- Cache/Materialisierungen/Scanlimits konfiguriert; SLO/Kosten Panels gesammelt.
- Versionsprotokolle von Formeln/Diagrammen; Schaltfläche „sich über Einsicht beschweren“.
16) Mini-Vorlagen
16. 1 Politik der Auto-Matching-Zeitplan
yaml auto_chart_policy:
time_series: ["line","area"]
categories_max: 8 distribution: ["histogram","boxplot"]
correlation: ["scatter","heatmap"]
choose_log_scale_if: growth_rate>0.15/week small_multiples_if: series_count>6
16. 2 Insight Card
yaml insight:
id: "ggr_tr_spike_2025_10_12"
metric: ggr segment: {country: "TR", device: "Android"}
change: {type: "wow", delta_pct: 12.4, ci95: [9.8,14.7]}
drivers: ["Sports +18%", "Slots +7%"]
confidence: 0.86 actions: ["увеличить лимит кампании TR Android на 10%"]
disclaimer: "наблюдение, не доказанная причинность"
16. 3 Beispiel für NL→SQL in UI (beleuchtet)
sql
-- Вопрос: "Как менялся ARPPU по устройствам за 30 дней?"
select dt::date as dt, device_os, avg(revenue_per_payer) as arppu from mart_daily_player where dt >= current_date - interval '30 day'
group by 1,2 order by 1,2;
16. 4 Testkit für NL→Viz
yaml tests:
- ask: "Покажи распределение депозитов за неделю"
expect:
chart: "histogram"
binning: true field: "deposit_amount"
17) Das Ergebnis
Die AI-Visualisierung der Metriken ist nicht "die klugen Bilder", und den durchgehenden Prozess: die semantische Schicht → NL→Query → Query→Viz → Insight Engine → die erklärbaren Narrativa → die Handlungen und die Kontrolle des Vertrauens. Mit den richtigen Guardrails (Datenschutz, Zahlenprüfung, Unsicherheit, A11y, FinOps) verwandelt es die Berichterstattung in operative Entscheidungen, beschleunigt die Analyse und erhöht die Datenkultur im gesamten Unternehmen.