Шинохти намуна
Шинохти намуна
Шинохти намуна соҳаест, ки дар он алгоритмҳо ёфтани сохторҳои устуворро дар додаҳо меомӯзанд: синфҳо, кластерҳо, шаклҳои такрорӣ, мотивҳо ва вобастагӣ. Ҳадаф аз он иборат аст, ки ба таври худкор "шакли ҳиссиёт" -ро муайян кунад ва онҳоро барои пешгӯӣ, ҷустуҷӯҳои шабеҳӣ, муайянкунии сегмент ва қабули қарорҳо истифода барад.
1) Танзими вазифаҳо
Таснифот: таъини объект ба синф (қаллобӣ/қаллобӣ, намуди ҳодиса).
Таснифи бисёрҷабҳа/бисёрҷабҳа: синфҳои сершумор дар як вақт.
Гурӯҳбандӣ ва сегментатсия: гурӯҳбандӣ бидуни тамғакоғазҳо, бо нишон додани гурӯҳҳои аномалӣ/нишонаҳо.
Гурӯҳбандӣ/ҷустуҷӯи монандӣ: фармоиши аҳамият, ҳамсоягони наздиктарин.
Ҷудосозии сохторҳо: аломатгузории қисмҳои объект (тасвир, сабти журнал, сессия).
Шинохти пайдарпаӣ: нишонаҳо барои силсилаи вақт/гузоришҳо/матн.
Гирифтани қоидаҳо ва ангезаҳо: маҷмӯаҳо/пайдарпайии зуд-зуд, қоидаҳои ассоциативӣ.
Вазифаҳои графикӣ: таснифи гиреҳ/канор, кашфи ҷомеа.
- Назорат (барчаспҳо мавҷуданд), назоратӣ (кластерӣ/қоидаҳо), нимтайёр (барчаспҳои псевдо), худидоракунанда (худидоракунанда: контрастӣ/афзоиш).
2) Маълумот ва нуқтаи назар
Ҷадвал: хусусиятҳои ададӣ ва категорикӣ; таъсири муштарак, омори равзана.
Вақтҳо/гузоришҳои рӯйдодҳо: ақибмонӣ, тамоюлҳо, мавсимӣ, хусусиятҳои DTW, хусусиятҳои спектралӣ.
Матн: нишонаҳо/ҷобаҷогузорӣ (Bag-of-Words, TF-IDF, word2vec/fastText, BERT-дохилкунӣ), n-грамм, ибораҳои асосӣ.
Тасвирҳо/Аудио: Хусусиятҳои Спектра/Бор, Дескрипторҳои маҳаллӣ (SIFT/HOG), CNN Global Embeddings.
Графикҳо: матритсаи ҳамсоягӣ, node2vec/DeepWalk, GNN-ҷобаҷогузорӣ.
Бисёр модул: синтези дер/барвақт, диққати салиб.
Принсипҳои асосӣ: дурустии вақт, набудани ихроҷи оянда, стандартизатсия/миқёси робаст, рамзгузории категория (як-гарм/ҳадаф/ҳаш), коркарди дақиқи камбудиҳо ва партовҳо.
3) Усулҳо
3. 1 Омори классикӣ ва метрикӣ
Моделҳои хатӣ: регрессияи логистикӣ/хатӣ бо регуляризатсия (L1/L2/Elastic Net).
Усулҳои ҳамсояи наздиктарин: k-NN, дарахти тӯб/FAISS барои ҷобаҷогузории ҷустуҷӯ.
Усулҳои SVM/ядро: ядроҳои RBF/полиномӣ, як синфи SVM (барои "меъёр").
Bayes/гибридҳои содда: асосҳои зуд барои матн/категорияҳо.
Паст кардани андоза: PCA/ICA/t-SNE/UMAP барои визуалӣ ва коркарди пешакӣ.
3. 2 Дарахтҳо ва ансамблҳо
Ҷангали тасодуфӣ, мустаҳкамкунии градиентӣ (XGB oost/Light
Ҷойгиркунӣ/омехта: ансамблҳо аз моделҳои гетерогенӣ.
3. 3 Шабакаҳои нейрон аз рӯи усулҳо
Пайдарпаӣ: RNN/LSTM/GRU, Шабакаҳои муваққатии муваққатӣ, Трансформаторҳо (аз ҷумла барои қатори дароз).
Биниши компютерӣ: CNN/Res муайянкунӣ/сегментатсия (Faster/Mask R-CNN, U-Net).
Матн: Танҳо рамзгузор (синфи BERT), Рамзгузор-Декодер (T5), тасниф/рейтинг/NER.
Графҳо: GCN/GAT/Graph-SAGE барои намунаҳои сохторӣ.
3. 4 Истихроҷи намуна ва қоидаҳо
Маҷмӯаҳо/пайдарпайии зуд-зуд: Apriori/Eclat, FP-Growth, Prefix-Span.
Қоидаҳои ассотсиатсия: дастгирӣ/бардоштан/эътимод; Филтр аз рӯи арзиши бизнес
Мотивҳо/намунаҳои силсилаи вақт: Профили матритса, SAX, сегментатсия аз рӯи тағирёбии режим.
4) Санҷиш ва таҷрибаҳо
Тақсим: i.i.d. K-баробар барои маълумоти доимӣ; CV/rolling-windows муваққатӣ барои пайдарпаӣ.
Гурӯҳбандӣ ва гурӯҳбандӣ: назорати ихроҷи байни корбарон/ҷаласаҳо/маъракаҳо.
Санҷиши берунӣ: санҷиши ниҳоӣ дар давраи "оянда".
Асосҳо: қоидаҳои содда, пешгӯиҳои басомад, логрегати оддӣ/GBM.
5) Нишондиҳандаҳои сифат
Таснифот: дақиқӣ (дар тавозун), ROC-AUC, PR-AUC оид ба синфҳои нодир, логлосс, F1, дақиқ/ёдрас @ k, NDCG/Lift барои рейтинг.
Кластерӣ: силуэт, Дэвис-Булдин, Калински-Харабас; берунӣ - ARI/NMI дар ҳузури "стандарти тиллоӣ".
Ҷудосозии тасвир: IOU/Dice.
Пайдарпайҳо/NER: token-/субъекти сатҳи F1; вақт-ба-аввал-дуруст барои шинохти онлайн.
Нишондиҳандаҳои тиҷорат: фоидаи афзоянда, кам кардани сарбории дастӣ, суръати коркард.
6) Тафсир ва эътимод
Глобалӣ: аҳамияти хусусият (ба даст овардан/тағир додан), PDP/ICE, SHAP-хулоса.
Маҳаллӣ: SHAP/LIME/лангарҳо барои шарҳи ҳалли мушаххас.
Барои қоидаҳо: ченакҳои шаффоф (дастгирӣ/лифт), муноқишаҳои қоидаҳо, фарогирӣ.
Визуализатсияи ҷобаҷогузорӣ: UMAP/t-SNE барои намуна ва кластери "харитаҳо".
7) Устуворӣ ва сифати маълумот
Устуворӣ: скалерҳои тобовар (median/MAD), винзоризатсия, муҳофизат аз партовҳо.
Дрифт: мониторинги тақсимот (PSI/JS/KL), кашиш ва хусусияти мақсаднок, азнавбаҳодиҳии даврӣ.
Адолат: муқоисаи хатогиҳо аз рӯи сегмент, маҳдудиятҳо дар FPR/TPR, ғаразнок.
Махфият/мувофиқат: кам кардани майдонҳо, тахаллуссозӣ, дастрасӣ ба нақшҳо.
8) Қубур (аз маълумот ба истеҳсолот)
1. Муайян кардани вазифа ва сенарияҳои тасдиқи KPI (ва сенарияҳои тасдиқи "тиллоӣ").
2. Ҷамъоварии маълумот/тайёрӣ - схемаҳо, такмилдиҳӣ, минтақаҳои вақт, агрегатҳо ва ҷобаҷогузорӣ
3. Асосҳо: қоидаҳои оддӣ/logreg/GBM; санитария-чекҳо.
4. Ғанисозии намояндагӣ: хусусиятҳои домейн, ҷобаҷогузории усулҳо, мағозаи хусусиятҳо.
5. Омӯзиш ва интихоб: оптимизатсияи шабакаҳо/байҳо, таваққуфи барвақт, санҷиши салиб.
6. Калибрченкунӣ ва ҳудудҳо: Платт/изотоникӣ, интихоби ҳудудҳо барои арзиши тиҷорат.
7. Ҷойгиркунӣ: Партияи REST/GRPC/онлайн; нусхабардории артефактҳо ва схемаҳо.
8. Мониторинг: сифат (ML-ченакҳо + бизнес), тақсимот, таъхирҳо; огоҳиҳо ва runibooks.
9. Бозомӯзӣ: ҷадвал/аз рӯи ҳодисаи дрифт; Варақаҳои A/B/канарӣ.
9) Намунаҳои амалӣ аз рӯи сенария
Қаллобӣ ва баҳодиҳии хатар (табақ): GBM/stacking → хусусиятҳои графикӣ (пайвастшавӣ бо дастгоҳҳо/кортҳо) ва GNN илова кунед; маҳдудиятҳои қатъии ниҳонӣ; оптимизатсия аз ҷониби PR- AUC/recall @ FPR ≤ x%.
Фардикунонӣ ва мундариҷа (рейтинг): ҷобаҷогузории корбар/объект + сигнали клики бинарӣ; талафот: ҷуфт/рӯйхат; навсозиҳои онлайн.
Таҳлили журнал/пайдарпаӣ: TCN/Трансформатор, контрастативӣ оид ба афзоиш; муайян кардани ангезаҳо ва тағироти режим.
Шинохти матни ниятҳо/мавзӯъҳо: синфи BERT, танзими хуб; тафсир тавассути нишонаҳои калидӣ/диққат.
Тасвирҳо/Видео (Назорати сифат/Ҳодисаҳо): Таснифоти норасоӣ, маҳаллисозӣ (Grad-CAM/Mask R-CNN), Метрика ва Қоидаҳои густариш.
Графҳо (ҷамоаҳо/занҷирҳои қаллобӣ): GNN + эвристикаи аномалии графикӣ (дараҷа/секунҷа/коэффисиенти синфӣ).
10) Интихоби модел: Матритсаи қарори оддӣ
11) Усулҳои сабукгардонии хатогӣ ва барзиёд
Регуляризатсия (L1/L2/тарки мактаб), таваққуфи барвақт, афзоиш додани маълумот ва омехта/буридан (барои CV/аудио).
Назорати ихроҷ: тақсимоти қатъии вақт, буридани гурӯҳҳо, "яхкунӣ" -и воридкунӣ барои санҷиш.
Калибрченкунии эҳтимолият ва ҳудудҳои устувор дар доираи маҳдудиятҳои тиҷорат.
Ансамблинг/Шӯрбо намунавӣ барои муқовимат ба шишагӣ.
12) Рӯйхати назоратии пеш аз озодкунӣ
- Тақсимоти дуруст (муваққатӣ/гурӯҳӣ), ихроҷ нест
- Нишондиҳандаҳои устувор дар равзанаи OOT ва сегментҳои асосӣ
- Эҳтимолият санҷида мешаванд; ҳадди ниҳоӣ/матритсаи хароҷот муайян карда шудааст
- SLO-ҳо оғоз шудаанд: сифат, ниҳонӣ, мавҷудият
- Гузоришҳои Inference, версияҳои артефакт, шартномаҳои маълумот
- Нақшаи бозомӯзӣ ва стратегияи таназзул (таназзул)
- Ҳуҷҷатгузорӣ ва Runibooks (RCA, хатогиҳо, роҳҳои афзоиш)
Луғати хурд
Истихроҷи намуна: ёфтани маҷмӯаҳо/пайдарпайии зуд-зуд рухдода.
Ҷойгиркунӣ: Пешниҳоди вектории объекте, ки семантика/монандиро нигоҳ медорад.
Омӯзиши муқобил: омӯзише, ки мисолҳои "шабеҳ" -ро муттаҳид мекунад ва "гуногун" -ро тақсим мекунад.
Silhouette/NMI/ARI: ченакҳои сифати кластерӣ.
IOU/Зарфҳо: Нишондиҳандаҳои сифати сегментатсия.
Ҷамъ
Шинохти намуна на танҳо интихоби "модели X", балки интизоми намояндагӣ, тасдиқи дуруст ва давраи амалиётӣ мебошад. Намоишҳои қавӣ (хусусият/ҷобаҷогузорӣ), пойгоҳҳои устувор (GBM/SVM/CNN оддӣ), тақсимоти баландсифат ва мониторинги қатъӣ дар паҳлӯҳо бозгашти бештар медиҳанд. Мураккабиро илова кунед (меъмориҳои амиқ, бисёр моделҳо, графикҳо) танҳо вақте ки он ба андозагирии андозагирии ML ва бизнес оварда мерасонад.