Entscheidungsintelligenz

Decision Intelligence (DI) ist eine Disziplin, die Daten in überschaubare Entscheidungen und messbare Effekte verwandelt. DI kombiniert Kausalität, Prognose, Entscheidungsökonomie, Policy Design und MLOps/Operations in einem Lebenszyklus.

1) DI-Rahmen: OODA/SSDL

Observe (Signal): standardisierte Ereignisse, Qualität/Frische, Dedup und Kontext.
Orient (Sense): Interpretation: Kohorten, Segmente, kausale Graphen, Risikoprofile.
Decide: Politik (Regeln/Modelle/Banditen), Berücksichtigung von Einschränkungen und Fehlerkosten.
Act: Orchestrierung von Aktionen, Kanälen, Idempotenz, Prioritäten.
Lernen: kausale Bewertung des Effekts, Aktualisierung der Schwellenwerte/Richtlinien/Modelle.

2) Die Ökonomie der Entscheidungen

Wertefunktion: Umsatz/gespeicherter Schaden/Retention/Servicequalität.
Fehlerkosten: FP/FN in Geld und Risiko (RG/Compliance/Reputation).

Erwarteter Wert (EV):

[
EV = p_{\text{uspekh} }\cdot Value - p_{\text{vred} }\cdot Harm - Cost
]

Die Aktion ist zulässig, wenn „EV≥0“ und guardrails sind normal.
Risikoappetit: Grenzen für FPR, Interventionshäufigkeit, Schadens-/Beschwerdebudget, Fehlerbudget.

3) Kausalität und Prognosen

Wenn die Prognose ausreicht: risikoarme Allokation, Rangfolge nach Wahrscheinlichkeiten.
Wenn Kausalität benötigt wird: ROMI, Preis-/Limitpolitik, Sicherheit/Compliance. Verwenden Sie A/B, DiD, RDD, IV, synthetische Steuerung; beim Targeting - uplift und CATE.
Counterfactual Loop: Prognose → Wirkung → Wirkung → Neuberechnung von Uplift/Schwellenwerten.

4) Arten von Richtlinien

Regeln (Policy-as-Code): deterministisch, erklärbar; Basis und fail-safe.
Score-based: Wahrscheinlichkeiten/Score, Hysterese, cost-sensitive Schwellenwerte.
Kontext (Banditen): ε -greedy/Thompson zur Auswahl von Offices/Kanälen.
Sequentiell (RL): Mehrstufige Strategien mit Einschränkungen (safe RL).
Zusammengesetzte: Kaskade - Sicherheit/Compliance → Wirtschaft → UX.

5) DI-Architektur

Daten: kanonische Ereignisse (UTC, Versionen), Fichester (online/offline parity), Katalog.
Modelle: Register/Versionen, Kalibrierung, Drift-Monitoring (PSI/KL), PR- AUC/Recall@FPR≤x%.
Semantik und Metriken: Einheitliches KPI/guardrails-Vokabular, Frische-SLO.
Policy Engine: Entscheidungstabellen, AVAS/Kontexte, Hysterese, Rate-Limits, Prioritäten.
Action Orchestrator: garantierte Lieferung, Retrays, Idempotenz' action _ id', DLQ.
Beobachtbarkeit: Trace „correlation _ id“, Trichter „signal→decision→action→outcome“.
Sicherheit: RLS/CLS, PII-Maskierung, Zugriffs- und Lösungsprotokoll.

6) DI-Metriken

Qualität der Lösungen

Decision Precision/Recall: nach dem wahren Erfolg des Handelns.
Regret/Opportunity Loss: Rückstand auf optimale Politik.
Coverage: Der Anteil der Objekte, die die Aktion erhalten haben.
Latency p95: Signal→Decision/Decision→Action.
Fairness/Harms: Fehlerdifferenz nach Segmenten, Beschwerden, Appelle.

Geschäftlicher Effekt

ROMI/ROI Aktion, uplift @ k, Qini/AUUC.
Net Benefit: Wirkung − Kosten − Schaden.
Time-to-Impact: Zeit vom Signal bis zum messbaren Ergebnis.

7) Lösungsdesign (Entscheidungsdesign)

1. Formulieren Sie die Frage als Effekt: „Was ist der Retentionsgewinn von X für Y für T?“

2. Zeichnen Sie DAG, definieren Sie confounders/colliders.
3. Wählen Sie das Design: A/B, Quasi-Experiment oder reine Prognose + Ex-post-Bewertung.
4. Identifizieren Sie Aktion und Alternativen, Einschränkungen und Guardrails.
5. Legen Sie die Wertfunktion und das Risikobudget fest.
6. Beschreiben Sie die Richtlinie in der Entscheidungstabelle: Bedingungen → Aktion → Kanäle → Kuldown.
7. Score planen: Effektmetriken, Dauer, CATE-Segmente.
8. Definieren Sie Runbook-Incidents und Fallback-Regeln.

8) Hysterese, Häufigkeit und Konflikte

Hysterese: Die Eingangs-/Ausgangsschwellen sind unterschiedlich; verhindert das „Blinken“ von Interventionen.
Cooldown: Pausen zwischen Kontakten/Einschränkungen am selben Objekt.
Politische Konflikte: Prioritätsmatrix; „Sicherheit hat Vorrang“.
Quoten/Rate-limit: pro Kanal, Segment, Benutzer; gerechte Verteilung.

9) Ebenen der Autonomie

1. Ad-hoc: Der Mensch entscheidet, Daten fehlen.
2. Assisted: Das System bietet eine Lösung + Erklärung.
3. Automated: Auto-Lösungen innerhalb guardrails.
4. Adaptiv: Auto-Tuning von Schwellenwerten/Offer-Auswahl (Banditen).
5. Safe-Autonomy: Autonomie unter formalen Einschränkungen und Audits.

10) Entscheidungen unter Unsicherheit

Szenarienplanung: Basis/Stress/Extremum; Wirkungsbereiche.
Robustness: Eine Strategie, die gegen parametrische Fehler resistent ist.
POMDP-Intuition: Handeln Sie mit unvollständigen Informationen; Schätzen Sie die Kosten für Informationen (welches Experiment Sie durchführen).
Bayesisches Updating: Kombinieren Sie historisches Wissen und aktuelle Daten.

11) Dialog „Modelle der ↔ Politik“

Das Modell liefert die Skore/Verteilung der Ergebnisse.
Die Politik berücksichtigt die Kosten für Fehler, Einschränkungen und Fairness.
Die Abschnittslinie ist in einer expliziten Entscheidung Schwellenwertrichtlinie mit Versionsprotokoll.
Die Revision der Schwelle erfolgt nach EV, nicht nur nach ROC/PR.

12) Dokumente und Artefakte

Policy-Datenblatt (Vorlage)

Code/Version, Ziel und KPI des Effekts

Bedingungen/Fichi/Modell, Hysterese/Kuldown

Aktionen und Kanäle, Prioritäten und gegenseitige Ausschlüsse

Guardrails (FPR≤x%, Latenz p95≤y, RG/Compliance)

Bewertung: Testdesign, Metriken, Dauer

Audit/Erläuterung für Benutzer, Eigentümer

Entscheidungstabelle (Beispiel)

Bedingung	Der Kontext	Die Handlung	Kuldaun	Guardrails
`churn_uplift ≥ 0. 08` & `value_q ≥ 0. 8`	retenschn	offer L	7д	ROMI≥0, cap=1
`rg_risk ≥ τ` & `night`	RG	Pause + Tipp	1д	FPR≤1%
`fraud_score∈[τ1,τ2]`	Die Zahlung	Manuelle Prüfung	—	SLA 2h

Schema zur Protokollierung einer End-to-End-Lösung

`signal_id` → `decision_id` → `action_id` → `outcome_id` (+ `correlation_id`).

13) Governance und Compliance

Einheitliches Wörterbuch der Metriken und Versionierbarkeit der Formeln.
Policy Committee: Risikobeauftragter, Produkt, Daten, Compliance.
Prüfung von Entscheidungen: Erklärungen, Ablehnungsgründe, Berufungskanäle.
Ethik und Gerechtigkeit: Überwachung von Fehlern nach Gruppen; Ausschluss von geschützten Merkmalen aus den Regeln, wenn dies gesetzlich vorgeschrieben ist.

14) Häufige Fehler

Optimierung von Proxy-Metriken statt Business-Effekt (Goodhart).
Vermischung von Prognose und Kausalität; ROMI „durch Korrelation“.
Mangel an Hysterese und Couldounts → Spam/„ Blinken “.
Nicht berücksichtigte Fehlerkosten und Schaden für den Benutzer.
Stille Bearbeitungen von Schwellen/Formeln ohne Versionen und Änderungen.
Aktionen ohne Bewertung der Wirkung und „Schließen des Zyklus“.

15) Checkliste vor Veröffentlichung der DI-Richtlinie/System

Ziel als kausaler Effekt formuliert, Wertefunktion und Risikobudget vorgegeben
Gezeichnet von DAG; Bewertungsdesign (A/B/DiD/SC) und Metriken ausgewählt
Die Richtlinie ist in der Entscheidungstabelle beschrieben; es gibt Hysterese/Kuldown/Prioritäten
Die Modelle sind kalibriert; Schwellenwerte aus Fehlerkosten abgeleitet (EV)
Der Orchestrator der Aktion ist idempotent; Zeitschrift „signal→decision→action→outcome“ ist enthalten
Guardrails und Alerts angepasst; Runbooks und Fallback-Regeln sind fertig
Dashboards: Entscheidungstrichter, Wirkung (Uplift/ROI), Schaden/Beschwerden, Fairness
die Versionen/Eigentümer/Rechte des Zuganges/komplajens sadokumentirowany

Summe

Entscheidungsintelligenz ist ein System, keine Sammlung von Modellen: einheitliche Daten und Metriken → eine kausale und ökonomische Sicht auf die Wirkung → explizite Richtlinien und sichere Orchestrierung → strenge Bewertung und kontinuierliches Lernen. Ein solches System reduziert das Risiko, erhöht den ROI und macht Entscheidungen reproduzierbar, erklärbar und beherrschbar.

Entscheidungsintelligenz