Entscheidungsintelligenz
Entscheidungsintelligenz
Decision Intelligence (DI) ist eine Disziplin, die Daten in überschaubare Entscheidungen und messbare Effekte verwandelt. DI kombiniert Kausalität, Prognose, Entscheidungsökonomie, Policy Design und MLOps/Operations in einem Lebenszyklus.
1) DI-Rahmen: OODA/SSDL
Observe (Signal): standardisierte Ereignisse, Qualität/Frische, Dedup und Kontext.
Orient (Sense): Interpretation: Kohorten, Segmente, kausale Graphen, Risikoprofile.
Decide: Politik (Regeln/Modelle/Banditen), Berücksichtigung von Einschränkungen und Fehlerkosten.
Act: Orchestrierung von Aktionen, Kanälen, Idempotenz, Prioritäten.
Lernen: kausale Bewertung des Effekts, Aktualisierung der Schwellenwerte/Richtlinien/Modelle.
2) Die Ökonomie der Entscheidungen
Wertefunktion: Umsatz/gespeicherter Schaden/Retention/Servicequalität.
Fehlerkosten: FP/FN in Geld und Risiko (RG/Compliance/Reputation).
[
EV = p_{\text{uspekh} }\cdot Value - p_{\text{vred} }\cdot Harm - Cost
]
Die Aktion ist zulässig, wenn „EV≥0“ und guardrails sind normal.
Risikoappetit: Grenzen für FPR, Interventionshäufigkeit, Schadens-/Beschwerdebudget, Fehlerbudget.
3) Kausalität und Prognosen
Wenn die Prognose ausreicht: risikoarme Allokation, Rangfolge nach Wahrscheinlichkeiten.
Wenn Kausalität benötigt wird: ROMI, Preis-/Limitpolitik, Sicherheit/Compliance. Verwenden Sie A/B, DiD, RDD, IV, synthetische Steuerung; beim Targeting - uplift und CATE.
Counterfactual Loop: Prognose → Wirkung → Wirkung → Neuberechnung von Uplift/Schwellenwerten.
4) Arten von Richtlinien
Regeln (Policy-as-Code): deterministisch, erklärbar; Basis und fail-safe.
Score-based: Wahrscheinlichkeiten/Score, Hysterese, cost-sensitive Schwellenwerte.
Kontext (Banditen): ε -greedy/Thompson zur Auswahl von Offices/Kanälen.
Sequentiell (RL): Mehrstufige Strategien mit Einschränkungen (safe RL).
Zusammengesetzte: Kaskade - Sicherheit/Compliance → Wirtschaft → UX.
5) DI-Architektur
Daten: kanonische Ereignisse (UTC, Versionen), Fichester (online/offline parity), Katalog.
Modelle: Register/Versionen, Kalibrierung, Drift-Monitoring (PSI/KL), PR- AUC/Recall@FPR≤x%.
Semantik und Metriken: Einheitliches KPI/guardrails-Vokabular, Frische-SLO.
Policy Engine: Entscheidungstabellen, AVAS/Kontexte, Hysterese, Rate-Limits, Prioritäten.
Action Orchestrator: garantierte Lieferung, Retrays, Idempotenz' action _ id', DLQ.
Beobachtbarkeit: Trace „correlation _ id“, Trichter „signal→decision→action→outcome“.
Sicherheit: RLS/CLS, PII-Maskierung, Zugriffs- und Lösungsprotokoll.
6) DI-Metriken
Qualität der Lösungen
Decision Precision/Recall: nach dem wahren Erfolg des Handelns.
Regret/Opportunity Loss: Rückstand auf optimale Politik.
Coverage: Der Anteil der Objekte, die die Aktion erhalten haben.
Latency p95: Signal→Decision/Decision→Action.
Fairness/Harms: Fehlerdifferenz nach Segmenten, Beschwerden, Appelle.
Geschäftlicher Effekt
ROMI/ROI Aktion, uplift @ k, Qini/AUUC.
Net Benefit: Wirkung − Kosten − Schaden.
Time-to-Impact: Zeit vom Signal bis zum messbaren Ergebnis.
7) Lösungsdesign (Entscheidungsdesign)
1. Formulieren Sie die Frage als Effekt: „Was ist der Retentionsgewinn von X für Y für T?“
2. Zeichnen Sie DAG, definieren Sie confounders/colliders.
3. Wählen Sie das Design: A/B, Quasi-Experiment oder reine Prognose + Ex-post-Bewertung.
4. Identifizieren Sie Aktion und Alternativen, Einschränkungen und Guardrails.
5. Legen Sie die Wertfunktion und das Risikobudget fest.
6. Beschreiben Sie die Richtlinie in der Entscheidungstabelle: Bedingungen → Aktion → Kanäle → Kuldown.
7. Score planen: Effektmetriken, Dauer, CATE-Segmente.
8. Definieren Sie Runbook-Incidents und Fallback-Regeln.
8) Hysterese, Häufigkeit und Konflikte
Hysterese: Die Eingangs-/Ausgangsschwellen sind unterschiedlich; verhindert das „Blinken“ von Interventionen.
Cooldown: Pausen zwischen Kontakten/Einschränkungen am selben Objekt.
Politische Konflikte: Prioritätsmatrix; „Sicherheit hat Vorrang“.
Quoten/Rate-limit: pro Kanal, Segment, Benutzer; gerechte Verteilung.
9) Ebenen der Autonomie
1. Ad-hoc: Der Mensch entscheidet, Daten fehlen.
2. Assisted: Das System bietet eine Lösung + Erklärung.
3. Automated: Auto-Lösungen innerhalb guardrails.
4. Adaptiv: Auto-Tuning von Schwellenwerten/Offer-Auswahl (Banditen).
5. Safe-Autonomy: Autonomie unter formalen Einschränkungen und Audits.
10) Entscheidungen unter Unsicherheit
Szenarienplanung: Basis/Stress/Extremum; Wirkungsbereiche.
Robustness: Eine Strategie, die gegen parametrische Fehler resistent ist.
POMDP-Intuition: Handeln Sie mit unvollständigen Informationen; Schätzen Sie die Kosten für Informationen (welches Experiment Sie durchführen).
Bayesisches Updating: Kombinieren Sie historisches Wissen und aktuelle Daten.
11) Dialog „Modelle der ↔ Politik“
Das Modell liefert die Skore/Verteilung der Ergebnisse.
Die Politik berücksichtigt die Kosten für Fehler, Einschränkungen und Fairness.
Die Abschnittslinie ist in einer expliziten Entscheidung Schwellenwertrichtlinie mit Versionsprotokoll.
Die Revision der Schwelle erfolgt nach EV, nicht nur nach ROC/PR.
12) Dokumente und Artefakte
Policy-Datenblatt (Vorlage)
Code/Version, Ziel und KPI des Effekts
Bedingungen/Fichi/Modell, Hysterese/Kuldown
Aktionen und Kanäle, Prioritäten und gegenseitige Ausschlüsse
Guardrails (FPR≤x%, Latenz p95≤y, RG/Compliance)
Bewertung: Testdesign, Metriken, Dauer
Audit/Erläuterung für Benutzer, Eigentümer
Entscheidungstabelle (Beispiel)
Schema zur Protokollierung einer End-to-End-Lösung
`signal_id` → `decision_id` → `action_id` → `outcome_id` (+ `correlation_id`).
13) Governance und Compliance
Einheitliches Wörterbuch der Metriken und Versionierbarkeit der Formeln.
Policy Committee: Risikobeauftragter, Produkt, Daten, Compliance.
Prüfung von Entscheidungen: Erklärungen, Ablehnungsgründe, Berufungskanäle.
Ethik und Gerechtigkeit: Überwachung von Fehlern nach Gruppen; Ausschluss von geschützten Merkmalen aus den Regeln, wenn dies gesetzlich vorgeschrieben ist.
14) Häufige Fehler
Optimierung von Proxy-Metriken statt Business-Effekt (Goodhart).
Vermischung von Prognose und Kausalität; ROMI „durch Korrelation“.
Mangel an Hysterese und Couldounts → Spam/„ Blinken “.
Nicht berücksichtigte Fehlerkosten und Schaden für den Benutzer.
Stille Bearbeitungen von Schwellen/Formeln ohne Versionen und Änderungen.
Aktionen ohne Bewertung der Wirkung und „Schließen des Zyklus“.
15) Checkliste vor Veröffentlichung der DI-Richtlinie/System
- Ziel als kausaler Effekt formuliert, Wertefunktion und Risikobudget vorgegeben
- Gezeichnet von DAG; Bewertungsdesign (A/B/DiD/SC) und Metriken ausgewählt
- Die Richtlinie ist in der Entscheidungstabelle beschrieben; es gibt Hysterese/Kuldown/Prioritäten
- Die Modelle sind kalibriert; Schwellenwerte aus Fehlerkosten abgeleitet (EV)
- Der Orchestrator der Aktion ist idempotent; Zeitschrift „signal→decision→action→outcome“ ist enthalten
- Guardrails und Alerts angepasst; Runbooks und Fallback-Regeln sind fertig
- Dashboards: Entscheidungstrichter, Wirkung (Uplift/ROI), Schaden/Beschwerden, Fairness
- die Versionen/Eigentümer/Rechte des Zuganges/komplajens sadokumentirowany
Summe
Entscheidungsintelligenz ist ein System, keine Sammlung von Modellen: einheitliche Daten und Metriken → eine kausale und ökonomische Sicht auf die Wirkung → explizite Richtlinien und sichere Orchestrierung → strenge Bewertung und kontinuierliches Lernen. Ein solches System reduziert das Risiko, erhöht den ROI und macht Entscheidungen reproduzierbar, erklärbar und beherrschbar.