निर्णय बुद्धिमत्ता

निर्णय खुफिया (DI) एक अनुशासन है जो डेटा को प्रबंधनीय निर्णयों और एक औसत दर्जे का प्रभाव में बदल देता है। DI कार्य-कारण, पूर्वानुमान, निर्णय अर्थशास्त्र, नीति डिजाइन और MLOps/संचालन को एक जीवन चक्र में एकीकृत करता है।

1) DI फ्रेमवर्क: OODA/SSDL

निरीक्षण (सिग्नल): मानकीकृत घटनाएं, गुणवत्ता/ताजगी, डीडअप और संदर्भ।

ओरिएंट (सेंस): व्याख्या: सहवास, खंड, कारण रेखांकन, जोखिम प्रोफाइल।

निर्णय: नीति (नियम/मॉडल/डाकुओं), सीमाओं पर विचार और त्रुटियों की लागत।

अधिनियम: कार्रवाई, चैनल, निष्क्रियता, प्राथमिकताओं का ऑर्केस्ट्रेशन।

जानें: कारण प्रभाव का अनुमान, थ्रेसहोल्ड/नीतियां/मॉडल अपडेट करें।

2) समाधानों का अर्थशास्त्र

मूल्य समारोह: राजस्व/बरकरार नुकसान/प्रतिधारण/सेवा की गुणवत्ता।

त्रुटि की लागत: धन और जोखिम में एफपी/एफएन (आरजी/अनुपालन/प्रतिष्ठा)।

अपेक्षित मूल्य (EV):

[
EV = p_{\text{uspekh}} cdot मूल्य - p_{\text{vred}} cdot हानि - लागत
]

यदि 'EV≥0' और रेलिंग सामान्य हैं तो कार्रवाई की अनुमति है।

जोखिम भूख: एफपीआर पर सीमा, हस्तक्षेप की आवृत्ति, नुकसान/शिकायत बजट, त्रुटि बजट।

3) कारण और पूर्वानुमान

जब भविष्यवाणी पर्याप्त होती है: कम जोखिम वाले आवंटन, संभावनाओं द्वारा रैंकिंग।

जब कार्य-कारण की आवश्यकता होती है: ROMI, मूल्य/सीमा नीति, सुरक्षा/अनुपालन। A/B, DiD, RDD, IV, सिंथेटिक नियंत्रण का उपयोग करें; जब लक्ष्यीकरण - उत्थान और CATE।

काउंटरफैक्चुअल लूप: पूर्वानुमान प्रभाव प्रभाव - उत्थान/थ्रेसहोल्ड का रूपांतरण।

4) नीतियों के प्रकार

नियम (नीति-जैसा-कोड): नियतात्मक, व्याख्यात्मक; आधार और असफल-सुरक्षित।

स्कोर-आधारित: संभावनाएं/दर, हिस्टेरिसिस, लागत-संवेदनशील थ्रेसहोल्ड।

प्रासंगिक (डाकू): -greedy/थॉम्पसन ऑफ़ र/चैनल चुनने के लिए।

अनुक्रमिक (आरएल): बहु-चरण विवश (सुरक्षित आरएल) रणनीतियाँ।

घटक: कैस्केड - सुरक्षा/अनुपालन → अर्थव्यवस्था → यूएक्स।

5) डीआई वास्तुकला

डेटा: विहित घटनाएँ (यूटीसी, संस्करण), फिचस्टर (ऑनलाइन/ऑफ़लाइन समता), निर्देशिका।

मॉडल: रजिस्ट्री/संस्करण, अंशांकन, बहाव निगरानी (पीएसआई/केएल), PR-%।

शब्दार्थ और मैट्रिक्स: केपीआई/रेलिंग का एक शब्दकोश, एसएलओ ताजगी।

नीति इंजन: निर्णय तालिकाएं, एबीएसी/संदर्भ, हिस्टेरिसिस, दर-सीमा, प्राथमिकताएं।

एक्शन ऑर्केस्ट्रेटर: गारंटीकृत डिलीवरी, रेट्राई, आइडेम्पोटेंसी 'एक्शन _ आईडी', डीएलक्यू।

अवलोकन: 'कोरेलेशन _ आईडी', फ़नल "signal→decision→action→outcome" का पता लगाएं।

सुरक्षा: आरएलएस/सीएलएस, पीआईआई मास्किंग, पहुंच और निर्णय लॉग।

6) डीआई मेट्रिक्स

समाधानों की गुणवत्ता

निर्णय परिशुद्धता/स्मरण: कार्यों की वास्तविक सफलता द्वारा।

अफसोस/अवसर हानि: इष्टतम नीति से पिछड़ ना।

कवरेज: एक कार्रवाई प्राप्त करने वाली वस्तुओं का अनुपात।

विलंबता p95: Signal→Decision/Decision→Action।

निष्पक्षता/हार्म: खंड त्रुटि अंतर, शिकायतें, अपील।

व्यापार प्रभाव

ROMI/ROI क्रियाएं, उत्थान @ k, Qini/AUUC।

शुद्ध लाभ: प्रभाव − लागत − नुकसान।

समय-से-प्रभाव: संकेत से औसत दर्जे का परिणाम तक का समय।

7) निर्णय डिजाइन

1. एक प्रभाव के रूप में प्रश्न को फ्रेम करें: "वाई ओवर टी पर एक्स से पकड़ लाभ क्या है?"

2. एक DAG आरेखित करें, कन्फ़ाउंडर/कोलाइडर परिभाषित करें।

3. डिजाइन चुनें: ए/बी, अर्ध प्रयोग या शुद्ध पूर्वानुमान + पूर्व-पोस्ट स्कोर।

4. कार्रवाई और विकल्प, प्रतिबंध और रेलिंग को परिभाषित करें।

5. मूल्य फ़ंक्शन और जोखिम बजट सेट करें।

6. निर्णय तालिका में नीति का वर्णन करें: स्थितियां → कार्रवाई → चैनल → शीतलन।

7. मूल्यांकन की योजना: प्रभाव मैट्रिक्स, अवधि, CATE खंड।

8. घटना रनबुक और फॉलबैक नियमों को परिभाषित करें।

8) हिस्टेरिसिस, आवृत्ति और टकराव

हिस्टेरिसिस: इनपुट/आउटपुट थ्रेसहोल्ड अलग हैं; हस्तक्षेप को "चमकने" से रोकता है।

शीतलन: एक ही वस्तु पर संपर्क/बाधाओं के बीच रुकता है।

नीति संघर्ष: प्राथमिकता मैट्रिक्स; "सुरक्षा पूर्वता लेती है।"

कोटा/दर-सीमा: प्रति चैनल, खंड, उपयोगकर्ता; उचित वितरण।

9) स्वायत्तता का स्तर

1. तदर्थ: एक व्यक्ति तय करता है कि पर्याप्त डेटा नहीं है।

2. सहायता प्रदान की: सिस्टम एक समाधान + स्पष्टीकरण प्र

3. स्वचालित: रेलिंग के भीतर ऑटो-समाधान।

4. अनुकूली: ऑटो-ट्यूनिंग थ्रेसहोल्ड/ऑफ़र (डाकुओं) का चयन।

5. सुरक्षित-स्वायत्तता: औपचारिक प्रतिबंध और ऑडिटिंग के तहत स्वायत्तता।

10) अनिश्चितता के तहत समाधा

परिदृश्य योजना: बुनियादी/तनाव/चरम; प्रभाव सीमा।

मजबूती: एक रणनीति जो पैरामीट्रिक त्रुटियों के लिए मजबूत है।

POMDP अंतर्ज्ञान: अधूरी जानकारी के साथ कार्य करें; जानकारी की लागत का मूल्य (क्या प्रयोग करना है)।

बायेसियन अद्यतन: ऐतिहासिक ज्ञान और वर्तमान डेटा को मिलाएं।

11) मॉडल - नीति संवाद

मॉडल परिणामों की दर/वितरण का उत्पादन करता है।

नीति त्रुटियों, सीमाओं और निष्पक्षता की लागत को ध्यान में रखती है।

विभाजन रेखा एक संस्करण लॉग के साथ एक स्पष्ट निर्णय सीमा नीति में है।

थ्रेशोल्ड संशोधन - ईवी द्वारा, न केवल आरओसी/पीआर द्वारा।

12) दस्तावेज़ और कलाकृतियाँ

नीति पासपोर्ट (टेम्पलेट)

प्रभाव का कोड/संस्करण, उद्देश्य और केपीआई

शर्तें/सुविधाएँ/मॉडल, हिस्टेरिसिस/कूलडाउन

कार्रवाई और चैनल, प्राथमिकताएं और आपसी अपवाद

गार्ड (FPR≤x%, विलंबता p95≤y, RG/अनुपालन)

स्कोर: परीक्षण डिजाइन, मैट्रिक्स, अवधि

उपयोगकर्ता, मालिकों को लेखा परीक्षा/स्पष्टीकरण

निर्णय तालिका (उदाहरण)

हालत	संदर्भ	क्रिया	कूलडाउन	रेलिंग
'churn _ uplift ≥ 0। 08 '&' मान _ q ≥ 0। 8`	प्रतिधारण	प्रस्ताव L	7 डी	ROMI≥0, टोपी = 1
'rg _ जोखिम ' और 'रात'	आरजी	ठहराव + टिप	1 डी	FPR≤1%
'fraud_score∈[τ1,τ2]'	भुगतान	हस्तचालित जाँच	—	एसएलए 2 एच

"एंड-टू-एंड" समाधान लॉगिंग योजना

'signal _ id' → 'निर्णय _ id' → 'क्रिया _ id' → 'परिणाम _ id' (+ 'सहसंबंध _ id')।

13) शासन और अनुपालन

मैट्रिक्स और फॉर्मूला वर्शनिंग का एकीकृत शब्दकोश।

नीति समिति: जोखिम अधिकारी, उत्पाद, डेटा, अनुपालन।

निर्णयों का लेखा परीक्षा: स्पष्टीकरण, इनकार के कारण, अपील चैनल।

नैतिकता और निष्पक्षता: समूह द्वारा त्रुटियों की निगरानी; नियमों से संरक्षित सुविधाओं का बहिष्करण, जहां कानून द्वारा आवश्यक है।

14) लगातार त्रुटियाँ

व्यावसायिक प्रभाव (गुडहार्ट) के बजाय प्रॉक्सी मैट्रिक्स का अनुकूलन।

भ्रमित भविष्यवाणियां और कारण; ROMI "सहसंबंध द्वारा"।

हिस्टेरिसिस और कूलडाउन की अनुपस्थिति → स्पैम/" ब्लिंकिंग"।

त्रुटियों और उपयोगकर्ता को नुकसान की लागत के लिए बेहिसाब।

संस्करणों और चेंजलॉग के बिना थ्रेसहोल्ड/सूत्रों का शांत संपादन।

प्रभाव मूल्यांकन और "चक्र बंद" के बिना कार्रवाई।

15) प्री-रिलीज डीआई पॉलिसी/सिस्टम चेकलिस्ट

उद्देश्य को कारण प्रभाव, मूल्य समारोह और जोखिम बजट के रूप में कहा जाता है
डीएजी खींचा गया; मूल्यांकन डिजाइन (A/B/DiD/SC) और मैट्रिक्स चयनित
निर्णय तालिका में नीति का वर्णन किया गया है; हिस्टेरिसिस/कूलडाउन/प्राथमिकताएं हैं
मॉडल कैलिब्रेटेड हैं; त्रुटि लागत (ईवी) से प्राप्त थ्रेसहोल्ड
कार्यों का ऑर्केस्ट्रेटर अज्ञात है; signal→decision→action→outcome लॉग सक्षम
गार्ड और अलर्ट कॉन्फ़िगर किए गए हैं; रनबुक और फॉलबैक नियम तैयार हैं
डैशबोर्ड: निर्णयों की फ़नल, प्रभाव (उत्थान/आरओआई), नुकसान/शिकायतें, निष्पक्षता
संस्करण/मालिक/अभिगम अधिकार/अनुपालन प्रलेखित

कुल

निर्णय बुद्धिमत्ता एक प्रणाली है, मॉडल का एक सेट नहीं: समान डेटा और मैट्रिक्स - प्रभाव का एक कारण और आर्थिक दृष्टिकोण - स्पष्ट नीतियां और सुरक्षित ऑर्केस्ट्रेशन - कठोर मूल्यांकन और निरंतर सीखना। इस तरह की प्रणाली जोखिम को कम करती है, आरओआई को बढ़ाती है, और निर्णयों को प्रजनन योग्य, व्याख्यात्मक और प्रबंधनीय बनाती है।

निर्णय बुद्धिमत्ता