KI-Visualisierung von Metriken

1) Was ist KI-Visualisierung

Die KI-Visualisierung von Metriken ist eine Kontur, bei der Modelle (ML/LLM) automatisch:

1. Auswahl des geeigneten Diagramm- und Achsentyps,

2. Muster/Anomalien/Trendbrüche hervorheben,

3. einen erklärbaren Text formulieren (insight/narrative),

4. Maßnahmen vorschlagen (Next Best Action),

5. Passen Sie die Ansicht an den Kontext des Benutzers und des Geräts an.

Ziel ist es, den Weg von der Frage zur Antwort zu verkürzen: weniger manuelle Chartauswahl, mehr überprüfbare Bedeutungen.

2) Architektur in der Handfläche

1. Semantic Layer: einheitliche Definitionen von Metriken/Dimensionen (Glossar, Formeln, Aggregationen, Zugriffe).
2. NL→Query: Konvertieren einer natürlichen Sprachabfrage in SQL/SPARQL/DSL.
3. Query→Viz: Automatische Anpassung der Grammatik des Graphen und der Parameter (Achsen, Log-Skalen, Farbe/Form/Größe).
4. Insight Engine: Anomaliedetektion, Breakpoints, Saisonalität, causale Hinweise; Prioritäten der Signale.
5. Narrativ: Generieren von Faktencheck-Text mit Bezug auf Werte und Konfidenzintervalle.
6. RAG: Mischen des Kontextes aus dem Daten-/Konfigurationskatalog (Metadaten, Geschäftsregeln).
7. Politik Guardrails: Datenschutz/Zugang/Maskierung, Verifizierung von Zahlen und Links.
8. Lieferung: Web-Widgets, mobile Karten, PDF/Snap-Shots, Webhooks in CRM/Slack.

3) Graphen Grammatik und Auto-Matching

Grundsätze:

Zeit → Linie/Bereich; Kategorien (≤8) → Spalten/Kacheln; Ranking → Bar/Leaderboard; Verteilung → Histogramm/Violin/Box; Korrelation → Scatter/Heatmap.
Log-Achse bei exponentiellem Wachstum; Normierung (%) bei Bruchteilen; small multiples - wenn es viele Serien gibt.
Farbauswahl: semantische Paletten für Status; Farbe ≠ gleichzeitig ein Kanal von Ordnung und Kategorie.
Unterschriften nur dort, wo sie Sinn machen: Wir minimieren die „Tinte“.

ChartSpec-Vorlage (Pseudo-Vega-Lite):

yaml chart:
mark: line encoding:
x: {field: dt, type: temporal, timeUnit: day}
y: {field: ggr, type: quantitative, aggregate: sum}
color: {field: region, type: nominal, legend: top, limit: 6}
transforms:
- filter: "dt >= now()-90d"
- calculate: {expr: "rolling_mean(ggr,7)", as: "ggr_7d"}
annotations:
- rule: {type: "changepoint", method: "cusum"}
- band: {type: "confidence", metric: "ggr", level: 0. 9}
interactions: {tooltip: true, zoom: "x", brush: "x"}

4) NL→Viz: von der Frage zum Zeitplan

Parsing Absichten: Metrik, Schnitte, Periode, Filter, Aggregate.
Validierung auf semantischer Ebene: nur zulässige Felder/Formeln.
Post-Processing: Chart-Auswahl nach Feldtypen und Kardinalität, Auto-Schwelle Bining/Sampling.
Feedback: Zeige SQL/DSL und Download von Daten (maskiert), um Vertrauen aufzubauen.

Beispiel für eine DSL-Anfrage:

yaml ask: "Show GGR by country in 90 days, highlight drastic changes"
metric: ggr dims: [country, dt]
filters: {dt: "last_90d"}
viz_hint: "line + changepoints"

5) Insight Engine: Wie man „Bedeutungen“ generiert

Signale:

Anomalien: STL-Zerlegung, ESD/Prophet, BOCPD; Wir markieren die Richtung/den Betrag/das Vertrauen.
Trendbrüche: CUSUM/Chow-Test; Lokale Regressionen.
Saisonalität/Kampagnen: Vergleich „Urlaub vs normaler Tag“, uplift zu baseline.
Segment-Treiber: Shapley/Feature-Importance über Tabellenregression oder Gradient-Boost.
Kausale Hinweise: Angabe begleitender Veränderungen (im Rahmen der Beobachtung) + Erinnerung „das ist eine Korrelation“.

Prioritäten der Erkenntnisse:

1. Auswirkungen auf die Geschäftsmetrik, 2) Stärke des Effekts, 3) Neuheit, 4) Vertrauen.

6) Erzeugung einer Erzählung (Text)

Voraussetzungen: Fakten mit Zahlen und Daten, Angabe der Vergleichsbasis, Genauigkeit der Begriffe.

Vorlage:

💡 "GGR ist um + 12 gestiegen. 4% w/w (p95 CI: +9. 8…+14. 7) in TR nach dem Start der Promo-X-Kampagne 2025-10-12. Hauptbeitrag: Sport + 18%, Slots + 7%. Ein möglicher Grund ist der erhöhte mobile Traffic (Android, + 11%). Das ist eine Beobachtung, kein Beweis für Kausalität"

7) Anpassung an den Kontext (Personalisierung)

Rollen: C-Level - KPI-Karten und Narrative; Manager - Schnitte und Alerts; Analysen - SQL/DSL und Modellparameter.
Gerät: kompakte Sparklines auf dem Handy, Full Viz auf dem Desktop.
Geo/Sprache/Währung/Zeitzone - automatisch.

8) Erklärbarkeit und Vertrauen

Jede Signatur auf dem Diagramm ist anklickbar → zeigt die Berechnung (Formel, Aggregationen, Filter).
Wir geben die statistische Unsicherheit (Vertrauensbänder, Fehlerbalken) an.
Für LLM-Beschreibungen: RAG nach Metadaten, Abgleich der Zahlen nach Quelle (Überprüfung der Summen/Bereiche).
Änderungsprotokoll: Version von Formeln, Datasets, Charts.

9) Qualität und SLO-Visualisierung

Latency p95 rendering, time-to-first-insight, Anteil erfolgreicher NL-Abfragen.
Explainability score (Vorhandensein von Zahlen/Referenzen/CI im Narrativ).
Accuracy NL→SQL (ex. exact-match auf Referenzabfragen).
Zugänglichkeit: Kontrast, Alt-Text, Tastatur, Farbenblindheit.

10) Verfügbarkeit (A11y) und UX-Muster

Farbpaletten, unabhängig von der Farbwahrnehmung; Farbform/Muster duplizieren.
Textalternativen und Data-Table-Ansicht neben dem Diagramm.
Fokusfallen, vernünftige Tab-Reihenfolge; Skalieren, ohne die Achsen zu brechen.

11) Sicherheit und Privatsphäre

RLS/CLS auf Abfrage- und Datenebene tooltips.
Masking/Bining für seltene Kategorien, um Re-Identification zu vermeiden.
NL-Fragen Zeitschriften - PDn-Safe: Tokenisierung/Überarbeitung potenzieller PIIs.
Export von Screenshots/CSV - mit Wasserzeichen und Metadaten der Version.

12) Wirtschaft und Kosten

Cost-aware: Caching von Caches/Ergebnissen, Materialisierung von „heißen“ Schaufenstern, Sampling für die Vorschau.
Begrenzung von „schweren“ NL-Abfragen (Scan Caps), verzögertes Rendern für große Serien.
Günstige Modelle für die Basisdetektion + schwere Offline-Auswertungen in der Nacht.

13) Antipatterns

„Auto-Charts haben immer Recht“. Wir brauchen eine Validierung der Typen/Kardinalitäten/Logik der Metriken.
Too much ink. Komplexe 3D/dual-axis ohne → Verzerrung.
Ohne Angabe von Unsicherheit. Die Texte klingen „kategorisch“, sind aber irreführend.
NL→SQL ohne semantische Ebene. Fragilität und Aggregationsfehler.
Magische Einblicke ohne Bezug zu Zahlen. Misstrauen und Ablehnung des Instruments.

14) Fahrplan für die Umsetzung

1. Foundation: Semantische Ebene, Metrik-Glossar, Zugriffe (RLS/CLS), NL→SQL-Testkits.
2. MVP NL→Viz: Top-10-Fragen, Auto-Charts zur Grammatik, Validierung von Typen/Kardinalitäten.
3. Insight Engine: Anomalien/Breakpoints, Prioritäten, grundlegende Narrative mit CI.
4. RAG & Trust: Metadaten/Formeln, Evidence Log in UI einbinden.
5. A11y und Mobile: adaptive Karten, Alt-Texte, Kontrast/Tastatur.
6. FinOps: Caches/Materialisierungen, Scanlimits, Lastprofile.
7. Scale: Personalisierung nach Rolle, Szenario NLG Vorlagen, Integration in CRM/Warnungen.

15) Checkliste vor Veröffentlichung

Metriken und Dimensionen werden in der semantischen Schicht beschrieben; SELECT ist nicht zulässig.
Auto-Chart-Matching wird nach Typ/Kardinalität/Regeln validiert.
Narrative enthalten Zahlen, Vergleich, Basis und Vertrauensbereich.
Unsicherheits-/Error-Bars enthalten (falls zutreffend).
NL→SQL/DSL die Benchmarks bestehen; SQL-Ansicht für den Benutzer sichtbar.
RLS/CLS und Masking funktionieren in Tooltips/Exporten.
A11y: Kontrast, Alt-Texte, Tab-Navigation, Farbenblindheit.
Cache/Materialisierungen/Scanlimits konfiguriert; SLO/Kosten Panels gesammelt.
Versionsprotokolle von Formeln/Diagrammen; Schaltfläche „sich über Einsicht beschweren“.

16) Mini-Vorlagen

16. 1 Politik der Auto-Matching-Zeitplan

yaml auto_chart_policy:
time_series: ["line","area"]
categories_max: 8 distribution: ["histogram","boxplot"]
correlation: ["scatter","heatmap"]
choose_log_scale_if: growth_rate>0. 15/week small_multiples_if: series_count>6

16. 2 Insight Card

yaml insight:
id: "ggr_tr_spike_2025_10_12"
metric: ggr segment: {country: "TR", device: "Android"}
change: {type: "wow", delta_pct: 12. 4, ci95: [9. 8,14. 7]}
drivers: ["Sports +18%", "Slots +7%"]
confidence: 0. 86 actions: ["increase Android TR campaign limit by 10%"]
disclaimer: "observation, not proven causality"

16. 3 Beispiel für NL→SQL in UI (beleuchtet)

sql
-- Question: "How has ARPPU changed across devices in 30 days?"
select dt::date as dt, device_os, avg(revenue_per_payer) as arppu from mart_daily_player where dt >= current_date - interval '30 day'
group by 1,2 order by 1,2;

16. 4 Testkit für NL→Viz

yaml tests:
- ask: "Show the distribution of deposits for the week"
expect:
chart: "histogram"
binning: true field: "deposit_amount"

17) Das Ergebnis

Die AI-Visualisierung der Metriken ist nicht "die klugen Bilder", und den durchgehenden Prozess: die semantische Schicht → NL→Query → Query→Viz → Insight Engine → die erklärbaren Narrativa → die Handlungen und die Kontrolle des Vertrauens. Mit den richtigen Guardrails (Datenschutz, Zahlenprüfung, Unsicherheit, A11y, FinOps) verwandelt es die Berichterstattung in operative Entscheidungen, beschleunigt die Analyse und erhöht die Datenkultur im gesamten Unternehmen.

KI-Visualisierung von Metriken

Kontakt aufnehmen

Schneller Kontakt

Das Video wird bald aktualisiert

Wir sind derzeit sehr stark ausgelastet