निर्णय बुद्धिमत्ता
निर्णय बुद्धिमत्ता
निर्णय खुफिया (DI) एक अनुशासन है जो डेटा को प्रबंधनीय निर्णयों और एक औसत दर्जे का प्रभाव में बदल देता है। DI कार्य-कारण, पूर्वानुमान, निर्णय अर्थशास्त्र, नीति डिजाइन और MLOps/संचालन को एक जीवन चक्र में एकीकृत करता है।
1) DI फ्रेमवर्क: OODA/SSDL
निरीक्षण (सिग्नल): मानकीकृत घटनाएं, गुणवत्ता/ताजगी, डीडअप और संदर्भ।
ओरिएंट (सेंस): व्याख्या: सहवास, खंड, कारण रेखांकन, जोखिम प्रोफाइल।
निर्णय: नीति (नियम/मॉडल/डाकुओं), सीमाओं पर विचार और त्रुटियों की लागत।
अधिनियम: कार्रवाई, चैनल, निष्क्रियता, प्राथमिकताओं का ऑर्केस्ट्रेशन।
जानें: कारण प्रभाव का अनुमान, थ्रेसहोल्ड/नीतियां/मॉडल अपडेट करें।
2) समाधानों का अर्थशास्त्र
मूल्य समारोह: राजस्व/बरकरार नुकसान/प्रतिधारण/सेवा की गुणवत्ता।
त्रुटि की लागत: धन और जोखिम में एफपी/एफएन (आरजी/अनुपालन/प्रतिष्ठा)।
अपेक्षित मूल्य (EV):[
EV = p_{\text{uspekh}} cdot मूल्य - p_{\text{vred}} cdot हानि - लागत
]
यदि 'EV≥0' और रेलिंग सामान्य हैं तो कार्रवाई की अनुमति है।
जोखिम भूख: एफपीआर पर सीमा, हस्तक्षेप की आवृत्ति, नुकसान/शिकायत बजट, त्रुटि बजट।
3) कारण और पूर्वानुमान
जब भविष्यवाणी पर्याप्त होती है: कम जोखिम वाले आवंटन, संभावनाओं द्वारा रैंकिंग।
जब कार्य-कारण की आवश्यकता होती है: ROMI, मूल्य/सीमा नीति, सुरक्षा/अनुपालन। A/B, DiD, RDD, IV, सिंथेटिक नियंत्रण का उपयोग करें; जब लक्ष्यीकरण - उत्थान और CATE।
काउंटरफैक्चुअल लूप: पूर्वानुमान प्रभाव प्रभाव - उत्थान/थ्रेसहोल्ड का रूपांतरण।
4) नीतियों के प्रकार
नियम (नीति-जैसा-कोड): नियतात्मक, व्याख्यात्मक; आधार और असफल-सुरक्षित।
स्कोर-आधारित: संभावनाएं/दर, हिस्टेरिसिस, लागत-संवेदनशील थ्रेसहोल्ड।
प्रासंगिक (डाकू): -greedy/थॉम्पसन ऑफ़ र/चैनल चुनने के लिए।
अनुक्रमिक (आरएल): बहु-चरण विवश (सुरक्षित आरएल) रणनीतियाँ।
घटक: कैस्केड - सुरक्षा/अनुपालन → अर्थव्यवस्था → यूएक्स।
5) डीआई वास्तुकला
डेटा: विहित घटनाएँ (यूटीसी, संस्करण), फिचस्टर (ऑनलाइन/ऑफ़लाइन समता), निर्देशिका।
मॉडल: रजिस्ट्री/संस्करण, अंशांकन, बहाव निगरानी (पीएसआई/केएल), PR-%।
शब्दार्थ और मैट्रिक्स: केपीआई/रेलिंग का एक शब्दकोश, एसएलओ ताजगी।
नीति इंजन: निर्णय तालिकाएं, एबीएसी/संदर्भ, हिस्टेरिसिस, दर-सीमा, प्राथमिकताएं।
एक्शन ऑर्केस्ट्रेटर: गारंटीकृत डिलीवरी, रेट्राई, आइडेम्पोटेंसी 'एक्शन _ आईडी', डीएलक्यू।
अवलोकन: 'कोरेलेशन _ आईडी', फ़नल "signal→decision→action→outcome" का पता लगाएं।
सुरक्षा: आरएलएस/सीएलएस, पीआईआई मास्किंग, पहुंच और निर्णय लॉग।
6) डीआई मेट्रिक्स
समाधानों की गुणवत्ता
निर्णय परिशुद्धता/स्मरण: कार्यों की वास्तविक सफलता द्वारा।
अफसोस/अवसर हानि: इष्टतम नीति से पिछड़ ना।
कवरेज: एक कार्रवाई प्राप्त करने वाली वस्तुओं का अनुपात।
विलंबता p95: Signal→Decision/Decision→Action।
निष्पक्षता/हार्म: खंड त्रुटि अंतर, शिकायतें, अपील।
व्यापार प्रभाव
ROMI/ROI क्रियाएं, उत्थान @ k, Qini/AUUC।
शुद्ध लाभ: प्रभाव − लागत − नुकसान।
समय-से-प्रभाव: संकेत से औसत दर्जे का परिणाम तक का समय।
7) निर्णय डिजाइन
1. एक प्रभाव के रूप में प्रश्न को फ्रेम करें: "वाई ओवर टी पर एक्स से पकड़ लाभ क्या है?"
2. एक DAG आरेखित करें, कन्फ़ाउंडर/कोलाइडर परिभाषित करें।
3. डिजाइन चुनें: ए/बी, अर्ध प्रयोग या शुद्ध पूर्वानुमान + पूर्व-पोस्ट स्कोर।
4. कार्रवाई और विकल्प, प्रतिबंध और रेलिंग को परिभाषित करें।
5. मूल्य फ़ंक्शन और जोखिम बजट सेट करें।
6. निर्णय तालिका में नीति का वर्णन करें: स्थितियां → कार्रवाई → चैनल → शीतलन।
7. मूल्यांकन की योजना: प्रभाव मैट्रिक्स, अवधि, CATE खंड।
8. घटना रनबुक और फॉलबैक नियमों को परिभाषित करें।
8) हिस्टेरिसिस, आवृत्ति और टकराव
हिस्टेरिसिस: इनपुट/आउटपुट थ्रेसहोल्ड अलग हैं; हस्तक्षेप को "चमकने" से रोकता है।
शीतलन: एक ही वस्तु पर संपर्क/बाधाओं के बीच रुकता है।
नीति संघर्ष: प्राथमिकता मैट्रिक्स; "सुरक्षा पूर्वता लेती है।"
कोटा/दर-सीमा: प्रति चैनल, खंड, उपयोगकर्ता; उचित वितरण।
9) स्वायत्तता का स्तर
1. तदर्थ: एक व्यक्ति तय करता है कि पर्याप्त डेटा नहीं है।
2. सहायता प्रदान की: सिस्टम एक समाधान + स्पष्टीकरण प्र
3. स्वचालित: रेलिंग के भीतर ऑटो-समाधान।
4. अनुकूली: ऑटो-ट्यूनिंग थ्रेसहोल्ड/ऑफ़र (डाकुओं) का चयन।
5. सुरक्षित-स्वायत्तता: औपचारिक प्रतिबंध और ऑडिटिंग के तहत स्वायत्तता।
10) अनिश्चितता के तहत समाधा
परिदृश्य योजना: बुनियादी/तनाव/चरम; प्रभाव सीमा।
मजबूती: एक रणनीति जो पैरामीट्रिक त्रुटियों के लिए मजबूत है।
POMDP अंतर्ज्ञान: अधूरी जानकारी के साथ कार्य करें; जानकारी की लागत का मूल्य (क्या प्रयोग करना है)।
बायेसियन अद्यतन: ऐतिहासिक ज्ञान और वर्तमान डेटा को मिलाएं।
11) मॉडल - नीति संवाद
मॉडल परिणामों की दर/वितरण का उत्पादन करता है।
नीति त्रुटियों, सीमाओं और निष्पक्षता की लागत को ध्यान में रखती है।
विभाजन रेखा एक संस्करण लॉग के साथ एक स्पष्ट निर्णय सीमा नीति में है।
थ्रेशोल्ड संशोधन - ईवी द्वारा, न केवल आरओसी/पीआर द्वारा।
12) दस्तावेज़ और कलाकृतियाँ
नीति पासपोर्ट (टेम्पलेट)
प्रभाव का कोड/संस्करण, उद्देश्य और केपीआई
शर्तें/सुविधाएँ/मॉडल, हिस्टेरिसिस/कूलडाउन
कार्रवाई और चैनल, प्राथमिकताएं और आपसी अपवाद
गार्ड (FPR≤x%, विलंबता p95≤y, RG/अनुपालन)
स्कोर: परीक्षण डिजाइन, मैट्रिक्स, अवधि
उपयोगकर्ता, मालिकों को लेखा परीक्षा/स्पष्टीकरण
निर्णय तालिका (उदाहरण)
"एंड-टू-एंड" समाधान लॉगिंग योजना
'signal _ id' → 'निर्णय _ id' → 'क्रिया _ id' → 'परिणाम _ id' (+ 'सहसंबंध _ id')।
13) शासन और अनुपालन
मैट्रिक्स और फॉर्मूला वर्शनिंग का एकीकृत शब्दकोश।
नीति समिति: जोखिम अधिकारी, उत्पाद, डेटा, अनुपालन।
निर्णयों का लेखा परीक्षा: स्पष्टीकरण, इनकार के कारण, अपील चैनल।
नैतिकता और निष्पक्षता: समूह द्वारा त्रुटियों की निगरानी; नियमों से संरक्षित सुविधाओं का बहिष्करण, जहां कानून द्वारा आवश्यक है।
14) लगातार त्रुटियाँ
व्यावसायिक प्रभाव (गुडहार्ट) के बजाय प्रॉक्सी मैट्रिक्स का अनुकूलन।
भ्रमित भविष्यवाणियां और कारण; ROMI "सहसंबंध द्वारा"।
हिस्टेरिसिस और कूलडाउन की अनुपस्थिति → स्पैम/" ब्लिंकिंग"।
त्रुटियों और उपयोगकर्ता को नुकसान की लागत के लिए बेहिसाब।
संस्करणों और चेंजलॉग के बिना थ्रेसहोल्ड/सूत्रों का शांत संपादन।
प्रभाव मूल्यांकन और "चक्र बंद" के बिना कार्रवाई।
15) प्री-रिलीज डीआई पॉलिसी/सिस्टम चेकलिस्ट
- उद्देश्य को कारण प्रभाव, मूल्य समारोह और जोखिम बजट के रूप में कहा जाता है
- डीएजी खींचा गया; मूल्यांकन डिजाइन (A/B/DiD/SC) और मैट्रिक्स चयनित
- निर्णय तालिका में नीति का वर्णन किया गया है; हिस्टेरिसिस/कूलडाउन/प्राथमिकताएं हैं
- मॉडल कैलिब्रेटेड हैं; त्रुटि लागत (ईवी) से प्राप्त थ्रेसहोल्ड
- कार्यों का ऑर्केस्ट्रेटर अज्ञात है; signal→decision→action→outcome लॉग सक्षम
- गार्ड और अलर्ट कॉन्फ़िगर किए गए हैं; रनबुक और फॉलबैक नियम तैयार हैं
- डैशबोर्ड: निर्णयों की फ़नल, प्रभाव (उत्थान/आरओआई), नुकसान/शिकायतें, निष्पक्षता
- संस्करण/मालिक/अभिगम अधिकार/अनुपालन प्रलेखित
कुल
निर्णय बुद्धिमत्ता एक प्रणाली है, मॉडल का एक सेट नहीं: समान डेटा और मैट्रिक्स - प्रभाव का एक कारण और आर्थिक दृष्टिकोण - स्पष्ट नीतियां और सुरक्षित ऑर्केस्ट्रेशन - कठोर मूल्यांकन और निरंतर सीखना। इस तरह की प्रणाली जोखिम को कम करती है, आरओआई को बढ़ाती है, और निर्णयों को प्रजनन योग्य, व्याख्यात्मक और प्रबंधनीय बनाती है।