प्रासंगिक एनालिटिक्स
1) प्रासंगिक विश्लेषण क्या है और इसकी आवश्यकता क्यों है
प्रासंगिक विश्लेषण स्थितिजन्य संकेतों का निष्कर्षण और उपयोग है (जो, कब, किस उपकरण पर, किस उद्देश्य से, किस प्रणाली/बाजार की स्थिति में) निर्णय में सुधार करने के लिए: सिफारिशें, प्रस्ताव, जोखिम सीमा, अलर्स, अगली सबसे कार कार कार्य कार)।
लाभ: उच्च प्रासंगिकता, कम शोर क्रियाएं, रूपांतरण और प्रतिधारण लाभ, परिचालन लागत और जोखिम कम।
2) संदर्भ वर्गीकरण
उपयोगकर्ता: खंड, जीवन चक्र चरण, इरादा, व्यवहार इतिहास, भाषा।
उपकरण/क्लाइंट: प्रकार और मॉडल, ओएस/ब्राउज़र, नेटवर्क, कनेक्शन गुणवत्ता, बैटरी/सीपीयू।
समय: दिन का समय, सप्ताह का दिन, मौसम, कैलेंडर की घटनाएं, गतिविधि की "ताजा खिड़की"।
भू/स्थानीय: देश/क्षेत्र/बिक्री का बिंदु, भू-नियम और मूल्य, स्थानीय छुट्टियां।
परिचालन: सिस्टम बूट, कतारें, एपीआई सीमा, वर्तमान घटनाएं।
सामग्री: विषय/शैली/वस्तु की श्रेणी को देखा जा रहा है, मेटाडेटा।
व्यापार संदर्भ: अभियान, प्रोमो, मूल्य, सीमा, जोखिम विरोधी नियम।
मध्यम/बाहरी: मौसम, यातायात, विनिमय दर, वृहद रुझान (यदि प्रासंगिक हो)।
3) सिग्नल स्रोत और संग्रह
घटनाएँ और लॉग: क्लिक, विचार, लेनदेन, सिस्टम मैट्रिक्स।
क्लाइंट एसडीके/एज: डिवाइस सेंसर, विलंबता, स्थानीय विशेषताएं।
विशेष निर्देशिका: कैलेंडर/छुट्टियां, भू-परतें, सामग्री वर्गीकरण।
पर्यवेक्षक मॉडल: इरादा, विषय, विषाक्तता/जोखिम, सामग्री एम्बेडिंग।
कॉन्फ़िगरेशन और नियम: सक्रिय अभियान, फ्लैग, सीमाएँ।
अभ्यास: प्रत्येक संकेत संविदा (योजना, आवृत्ति, अनुमेय मूल्य) और गुणवत्ता (ताजगी/पूर्णता) के लिए।
4) प्रासंगिक विशेषताओं का सामान्यीकरण और गठन
वर्गीकरण और हैशिंग: उच्च-कार्डिनैलिटी सुविधाएँ - हैशिंग ट्रिक/एम्बेडिंग।
समय सुविधाएँ: घंटे/दिन के लिए चक्रीय एन्कोडिंग (पाप/कोस), खिड़कियों को फिसलना "अंतिम एन मिनट/घंटे/दिन"।
सत्र: सत्र सीमाओं (निष्क्रियता सीमा) का पता लगाना, "एक सत्र के भीतर" संकेत।
पदानुक्रम: strana→region→gorod; kategoriya→podkategoriya→teg।
इंटरैक्शन: डिवाइस _ os × locale × hour_bucket' प्रकार की विशेषताएं।
ऑनलाइन बनाम ऑफ़ लाइन: भौतिककरण विकल्पों के साथ फ़ीचर स्टोर में एक स्पेक सुविधा: ऑनलाइन (ms) और ऑफ़ लाइन (बैच)।
5) प्रासंगिक विश्लेषिकी वास्तुकला
रूपरेखा: Ingest संदर्भ संवर्धन फ़ीचर स्टोर (ऑनलाइन/ऑफ़लाइन) मॉडल/नियम सेवारत प्रतिक्रिया।
घटक:1. अनुबंध के साथ इवेंट बस (काफ्का/पल्सर/एनएटीएस) (एवरो/प्रोटोबुफ)।
2. फ़ीचर स्टोर:- ऑनलाइन: कम विलंबता के लिए KV/कैश (Redis/RockerDB)।
- ऑफ़ लाइन: प्रशिक्षण और विश्लेषण के लिए DWH/झील (Parquet/Delta/ClickHouse)।
- 3. संदर्भ संवर्धन सेवा: SDK/edge/directories से संदर्भ संग्रह, सामान्यीकरण, TTL और संस्करण।
- 4. निर्णय: मॉडल (ऑनलाइन स्कोरिंग) + नियम इंजन, प्रासंगिक डाकू।
- 5. डिलीवरी: एपीआई, वेबहूक, यूआई विजेट, पुश/चैट, सीआरएम/सीडीपी।
- 6. अवलोकन: एसएलओ, संदर्भ बहाव, कार्रवाई प्रभाव।
6) मॉडल और तरीके संदर्भ के अनुकूल हैं
संदर्भ डाकू (LinUCB/थॉम्पसन): एनबीए/ऑफ़र के लिए अनुसंधान/ऑपरेशन संतुलन।
उत्थान मॉडलिंग: संदर्भ-संवेदनशील क्रिया प्रभाव मॉडल (टी-/एस-/डीआर-विधियाँ)।
GBDT/टैबुलर NN इंटरैक्शन-ऑटो-सर्च के साथ Splines/संदर्भ चौराहों के लिए।
अनुक्रमिक मॉडल (आरएनएन/ट्रांसफॉर्मर): सत्र पैटर्न, HRED/GRU4Rec, घटनाओं और संदर्भों द्वारा आत्म-ध्यान।
संदर्भ क्लस्टरिंग: नीति/मॉडल मार्ग के लिए ऑनलाइन समूह।
संदर्भ के साथ नियम और थ्रेसहोल्ड: जोखिम सीमा घंटे/स्थान/सिग्नल गुणवत्ता पर निर्भर करती है।
7) रियल टाइम बनाम ऑफ़ लाइन
वास्तविक समय: समाधान - (100-500) एम। ऑनलाइन फीचर स्टोर संदर्भ, पूर्व-लोडेड निर्देशिका, कैश।
निकट-वास्तविक समय: खिड़कियां 1-5 मिनट, वृद्धिशील शोकेस, सस्ते संवर्धन।
ऑफ़ लाइन: प्रशिक्षण/अंशांकन, फीचर इंटरैक्शन का डिज़ाइन, प्रभाव विश्लेषण।
नियम: दोनों आकृतियों में सुविधाओं की समान परिभाषाएं; ऑनलाइन/ऑफ़लाइन स्थिरता परीक्षण।
8) संदर्भ गुणवत्ता और एसएलओ
ताजगी: X मिनट/सेकंड (सिग्नल प्रकार से) से पुराना नहीं।
पूर्णता - मुख्य संदर्भों का प्रतिशत जो भरे हुए हैं।
सटीकता/संगति: संदर्भ पुस्तक अनुपालन, वैध चौराहे।
ऑनलाइन सुविधाओं को पढ़ ने और निर्णय लेने के लिए लेटेंसी p95/p99।
उत्थान/CTR/ARPPU/Recall @ K संदर्भ संवेदनशील व्यवसाय मैट्रिक्स हैं।
9) कारण और प्रयोग
विचरण में कमी के लिए संदर्भ या CUPED द्वारा A/B स्तरीकृत।
रेलिंग के साथ डाकुओं: अनुसंधान पर क्षति सीमा।
अर्ध-प्रयोग: बाहरी परिवर्तनों (क्षेत्र/मौसम) के लिए अंतर-इन-अंतर/सिंथेटिक नियंत्रण।
बहु-लक्ष्य व्यापार बंद: संदर्भ के लिए युग्मित लक्ष्यों (लाभ/जोखिम/शिकायतों) का अनुकूलन।
10) गोपनीयता, सहमति और सुरक्षा
प्रत्येक संदर्भ स्रोत के लिए सहमति और लक्ष्य
संवर्धन/भंडारण से पहले पीआईआई न्यूनतम और टोकन।
आरएलएस/सीएलएस: संदर्भ-निर्भर दृश्यता नियम, भंडारण का भू-स्थानीयकरण।
टीटीएल नीतियां: संवेदनशील संदर्भों के लिए तंग प्रतिधारण अवधि।
ऑडिट और डीएसएआर: डेटा विषय द्वारा संदर्भ दिखाने/हटाने की क्षमता।
11) अवलोकन और निदान
संदर्भ डैशबोर्ड: सुविधाओं द्वारा कवरेज, "अज्ञात/अन्य" का हिस्सा, सिग्नल उम्र बढ़ ने।
संदर्भ बहाव: वितरण द्वारा पीएसआई/जेएस; स्वचालित अलर्ट।
ट्रेस-आईडी: एंड-टू-एंड इवेंट ट्रेस संवर्धन निर्णय - क्रिया।
पोस्ट-एक्शन एट्रिब्यूशन: कौन से संदर्भ प्रभाव के लिए महत्वपूर्ण थे।
12) ज्ञान रेखांकन और शब्दार्थ के साथ एकीकरण
संदर्भ ऑन्कोलॉजी: सख्त मान और पदानुक्रम (समय/भू/उपकरण)।
केजी-संवर्धन: "संबंधित" तथ्यों का निष्कर्षण (उदाहरण के लिए, provayder↔kategoriya↔region)।
शब्दार्थ खोज: रैंकिंग में फ़िल्टर/वजन के रूप में संदर्भ।
13) किनारे का संदर्भ
स्थानीय विशेषताएँ: नेटवर्क गुणवत्ता, विलंबता, बैटरी, हार्डवेयर कॉन्फ़ि
किनारे समाधान: हल्के मॉडल/नियम; हम केवल समुच्चय और अवैयक्तिक विशेषताएं भेजते हैं।
तुल्यकालन: संदर्भ अद्यतन का बफरिंग और डीडुप्लीकेशन।
14) एंटीपैटर्न
"संदर्भ बहुत कुछ है - इसका मतलब बेहतर है। "रिट्रेनिंग, बढ़ ती विलंबता और लागत।
असंगत सुविधाएँ ऑनलाइन/ऑफ़लाइन। परस्पर विरोधी निष्कर्ष और गिरावट।
टीटीएल के बिना पंचांग संकेत। कचरे का संचय, गोपनीयता उल्लंघन।
चुनें और "मुक्त" योजनाएँ। माइनर विकास के दौरान उपभोक्ता टूट जाते हैं।
विभिन्न संदर्भों के लिए समान नीतियां। दक्षता और निष्पक्षता का नुकसान।
कार्य की अनदेखी करें। सहसंबंधों की प्रतिक्रिया - क्षति।
15) कार्यान्वयन रोडमैप
1. डिस्कवरी: समाधान मानचित्र और समय सीमा, संदर्भों की सूची, मालिक, जोखिम।
2. अनुबंध और शब्दकोश: सिग्नल योजनाएं, संदर्भ पुस्तकें, टीटीएल, सहमति।
3. फ़ीचर स्टोर: सिंगल फ़ीचर स्पेसिफिकेशन (ऑनलाइन/ऑफ़लाइन), स्थिरता परीक्षण।
4. एमवीपी मॉडल/नीति: 3-5 प्रमुख संदर्भ, मैट्रिक्स, डिलीवरी चैनल।
5. प्रयोग: ए/बी स्तरीकृत, एक छोटे से अंश पर डाकुओं।
6. अवलोकन: विलंबता/ताजगी/कवरेज द्वारा एसएलओ, बहाव अलर्ट।
7. सुरक्षा/ : आरएलएस/सीएलएस, टोकन, डीएसएआर प्रक्रियाएं।
8. स्केल: अधिक संदर्भ, निजीकरण, केजी/शब्दार्थ, बढ़ त।
16) प्री-रिलीज़चेकलिस्ट
- संदर्भ संकेतों में अनुबंध, टीटीएल, मालिक और सहमति है।
- फीचर स्टोर में सुविधाएँ घोषित की जाती हैं; ऑनलाइन/ऑफ़लाइन की गणना समान रूप से की जाती है।
- विलंबता p95 पढ़ ने की सुविधाएँ और लक्ष्य विंडो में निर्णय लेना।
- बहाव/कवरेज की निगरानी की जाती है; अलर्ट और रनबुक हैं 'और।
- A/B या बैंड कॉन्फ़िगर किए गए हैं; रेलिंग परिभाषित।
- गोपनीयता और आरएलएस/सीएलएस नीतियां सक्षम हैं; निर्यात अवैयक्तिक है।
- प्रलेखन: संदर्भों, स्कीमा, नमूना प्रश्नों और नियमों की शब्दावली।
17) मिनी टेम्पलेट्स
17. 1 संदर्भ सुविधा विनिर्देश (छद्म-YAML)
yaml feature:
name: hour_bucket type: categorical source: event_time transform: "floor(minute/15)" # 15-минутные окна ttl: 30m online: true offline: true dq:
allowed: [0..95]
freshness_sla: 60s
17. 2 संदर्भ के साथ अगली सर्वश्रेष्ठ कार्रवाई
yaml nba_policy:
context_require:
- locale in ["en","ru","tr"]
- device_os in ["Android","iOS"]
model: "linucb_v5"
guardrails:
- latency_p95_ms <= 200
- complaint_rate_24h < 0. 02 fallback: "rule_based_offer_if_model_conf<0. 55"
17. ऑनलाइन स्टोरफ्रंट के लिए 3 आइडेम्पोटेंट विलय
sql merge into fs_online as t using incoming as s on t. key = s. key and t. feature = s. feature when not matched then insert (key, feature, val, ts) values (...)
when matched and s. ts > t. ts then update set val=s. val, ts=s. ts;
17. 4 स्तरीकृत प्रयोग
yaml ab_test:
strata: [device_os, hour_bucket, region]
allocation: {control: 0. 5, treatment: 0. 5}
metrics: [uplift_cr, arppu, complaints]
duration_min_days: 7 stop_rules: {p_value<=0. 05, min_effect_size: 0. 5pp}
18) नीचे की रेखा
प्रासंगिक एनालिटिक्स केवल "स्थानापन्न घंटे और देश" नहीं है, बल्कि एक एंड-टू-एंड इंजीनियरिंग सर्किट है: स्पष्ट रूप से वर्णित संकेत और टीटीएल, लगातार ऑनलाइन/ऑफ़लाइन सुविधाएँ, मॉडल और नीतियां जो संदर्भ में हैं। एक ठीक से ट्यून किया गया संदर्भ हर बातचीत को एक स्मार्ट, समय पर और सुरक्षित विकल्प में बदल देता है जो उत्पाद और व्यापार मैट्रिक्स को मापने में सुधार करता है।