Омӯзиши модели мутобиқшавӣ
1) Чаро мутобиқшавӣ
Ҷаҳон назар ба давраҳои озодшавӣ тезтар тағйир меёбад. Омӯзиши мутобиқшавӣ ба модел имкон медиҳад, ки бидуни азнавсозӣ ба додаҳо/усулҳои нав мутобиқ шаванд: сифатро нигоҳ доранд, вақти вокунишро коҳиш диҳанд ва арзиши моликиятро коҳиш диҳанд.
Вазифаҳо:- Сифати устувор ҳангоми кашидани манбаъ, хусусият, нишона, консепсия.
- Таъхири ҳадди аққал байни муайянкунии шишагӣ ва навсозии параметр.
- Арзиш ва хатарҳои назоратшаванда (махфият/адолат/амният).
2) Намудҳо ва сигналҳои дрифт
Дрифти маълумот (ковариат): Тақсимоти X тағйир ёфт.
Drift label: басомадҳои синф/сиёсати тамғагузорӣ.
Сигналҳо: PSI/JS/KS аз рӯи хусусиятҳо, мониторинги калибрченкунӣ, паст шудани нишондиҳандаҳо дар нигоҳдорӣ/проксисамерҳо, зиёд шудани ҳиссаи барзиёдии одамон, хӯшаҳо дар шикоятҳо/ҳодисаҳо.
3) Триггери мутобиқшавӣ
Ҳадди ниҳоӣ: PSI> X, p-value <α, калибрченкунӣ аз синхронизатсия.
Муваққатӣ: тирезаҳои ҳаррӯза/ҳарҳафтаина/слайдӣ.
Чорабинӣ: версияи нави маҳсулот, нархгузорӣ, воридшавии бозор.
Иқтисодӣ: хароҷот ба хатогӣ/ҳиссаи талафот> маҳдудият.
Триггерҳо ҳамчун рамзи сиёсат рамзӣ карда мешаванд ва баррасӣ карда мешаванд.
4) Архетипҳои омӯзиши мутобиқшавӣ
1. Қатораи такрорӣ: оддӣ ва боэътимод; оҳиста вокуниш нишон медиҳад.
2. Омӯзиши афзоянда/онлайн: навсозии вазнҳо дар ҷараён; фавран, аммо хатари фаромӯш кардан.
3. Танзими хуби гармӣ: оғозёбӣ бо модели қаблӣ, таълими иловагӣ дар равзанаи нав.
4. PEFT/LORA/адаптерҳо (LLM/векторҳо): навсозиҳои тези танг бидуни FT пурра.
5. Distillation/Муаллим → Донишҷӯ: интиқоли дониш ҳангоми тағир додани меъморӣ/домен.
6. Мутобиқсозӣ/интиқоли домейн: яхкунонии асосӣ + танзими хуби "сар".
7. Мета-омӯзиш/Гипернетҳо: Бозомӯзии суръатро бо якчанд мисол.
8. Бандитҳо/RL: Мутобиқсозии сиёсат дар ҷавоб ба аксуламали муҳити зист.
9. Омӯзиши федералӣ: фардикунонӣ бидуни гирифтани маълумоти хом.
5) Стратегияҳои ҳолати маълумот
Ҷараён: оптимизаторҳои онлайн (SGD/Adam/Adagrad), тарозуи EMA, тирезаҳои лағжанда, буфери репетитсионӣ барои зидди фаромӯшӣ.
Микро-маҷмӯаҳо: мини-муназзами муқаррарӣ (соат/рӯз), таваққуфи барвақт аз рӯи санҷиш.
Тирезаҳои партия: ғалтаки 7/14/30d аз рӯи домен, барои синфҳои нодир гурӯҳбандӣ карда мешаванд.
Миқдори ками тир: PEFT/адаптерҳо, танзими фаврӣ, ҷустуҷӯи замимаҳо барои LLM.
6) Назорати фаромӯшии фалокатбор
Репетиция.
Регуляризатсия: EWC/LWF/ELR - ҷазо барои дур шудан аз аҳамияти қаблӣ.
Дистиллятсия: KLD ба модели гузашта дар маълумоти лангар.
Омехтаи мутахассисон/ҳолати контекст: Мутахассисони гуногун аз рӯи сегмент.
Яхкунӣ ва ғайра: яхкунӣ аз асос, таълими иловагии қабатҳои болоӣ.
7) Фардикунонӣ ва сегментатсия
Сарварони глобалӣ + маҳаллӣ: пойгоҳи умумӣ, "сарҳо" дар як сегмент (минтақа/канал/VIP).
Адаптерҳо/ҷобаҷогузории як корбар: хотираи осон барои корбар.
Дарвозабон аз рӯи контекст: равона кардани трафик ба беҳтарин коршинос (ВМ/роутерҳо).
Гвардияи боадолатона: Боварӣ ҳосил кунед, ки фардикунонӣ баробарии гурӯҳро бадтар намекунад.
8) Омӯзиши фаъол (мард-дар-гардиш)
Стратегияҳои дархосткунӣ: номуайянии ҳадди аксар, маржа/энтропия, маҷмӯи аслӣ, кумитаи вайронкунӣ.
Буҷаҳо ва мӯҳлатҳо: квотаҳои ҳаррӯза, SLA-ҳои вокуниш.
Қабули нишона: назорати розигии эзоҳдиҳандагон, озмоишҳои хурди тиллоӣ.
Пӯшидани давр: омӯзиши фаврии иловагӣ дар тамғакоғазҳои нави ҳақиқӣ.
9) Интихоби оптимизаторҳо ва ҷадвалҳо
Онлайн: Adagrad/AdamW бо таназзул, клип-град, имконоти EMA.
Ҷадвалҳо: бозоғозии косинус, як давра, гармшавӣ → пӯсида.
Барои ҷадвал: GBDT-и афзоянда (навсозии дарахтон/илова кардани дарахтҳо).
Барои LLM: дараҷаи lr, дараҷаи LORA барои вазифа, назорати тарки сифат тибқи қоидаҳо.
10) Маълумот барои мутобиқшавӣ
Буфери онлайн: ҳолатҳои нави мусбат/манфӣ, тавозуни синф.
Азнавбаҳодиҳӣ: вазнбардории аҳамияти pri covariate drift.
Истихроҷи намунаҳои сахт: хатогиҳои вазнин дар афзалият.
Шартномаҳои маълумот: схемаҳо/ниқобҳои сифат/PII - ҳамон тавре ки барои ҷараёни истеҳсолӣ.
11) Арзёбии сифати мутобиқшавӣ
Pre-/Post-lift: A/B ё тафсири квази-таҷриба.
Тасдиқи яклухт: тақсимоти вақт, санҷиши вақт.
Гвардияҳо: калибрченкунӣ, заҳролудшавӣ/сӯиистифода, ҳадди эътимоднокии бехатар.
Пайгирии бадтарин сегмент: Мониторинги бадтарин сегмент, на танҳо ба ҳисоби миёна.
Staleness KPI: вақт аз мутобиқшавии охирин бомуваффақият.
12) MLOps: Раванд ва артефактҳо
Феҳристи моделӣ: версия, сана, равзанаи маълумот, хусусияти ҳаш, гипер, артефактҳо (PEFT).
Хати маълумот: аз манбаъҳо то мағозаи хусусӣ; яхкунонии иловаро таълим медиҳад.
Қубурҳо: DAG dlya fit → eval → мусоидат ба § канарейка → ролик, с худкор-бозгашт.
Shadow/Canary: муқоиса бо версияи истеҳсолӣ дар трафики воқеӣ.
Мушоҳида: таъхир/арзиш, дуршавӣ, адолат, бехатарӣ, меъёри аз ҳад зиёд.
Сиёсати озодкунӣ: кӣ ва аз рӯи кадом ченакҳо "мусоидат мекунад".
13) Амният, дахолатнопазирӣ, ҳуқуқҳо
Кам кардани PII ва ниқоб, хусусан дар буферҳои ҷараён.
Мутобиқсозии ҳифзи махфият: Ҷамъбасти FL/бехатар, DP-клипҳо/садоҳо барои доменҳои ҳассос.
Этика: манъи аутоадапт дар қарорҳои дорои хавфи баланд (одам-дар-ҳалқа ҳатмист).
Бегона кардани дониш: назорати ихроҷ тавассути калидҳои дистилятсия/дарунсохт.
14) Мутобиқсозии иқтисодиёт ва SLO
Навсозиҳои SLA: масалан, TTA (вақти мутобиқ шудан) ≤ 4 соат ҳангоми ғарқ шудан.
Сарпӯши буҷа: Соатҳои GPU/маҳдудиятҳои рӯз, ҳадди ақалли сарпӯш/нигоҳдорӣ.
Сиёсати сарфакорона: тирезаҳои шабона, афзалияти моделҳои интиқодӣ, PEFT ба ҷои FT пурра.
Кэш/ретривер: барои LLM - баланд бардоштани заминаи бидуни омӯзиши пурра.
15) Антипаттернҳо
"Ҳамеша ва дар ҳама ҷо биомӯзед": онлайн-беназорат ба самти варта гузаред.
Набудани репетиция/мунтазам: фаромӯшкунии фалокатбор.
Не эвали офлайнӣ/онлайн: релизҳо "бо чашм".
Бозомӯзии шикоятҳо/муроҷиатҳо: истифодаи фикру мулоҳизаҳои ҳамлагарон.
Омезиши домейн: як модели ягона барои сегментҳои куллан гуногун бидуни масир.
Пайгирии сифр: шумо наметавонед он чизеро, ки такмил додаед, дубора таҷдид кунед.
16) Харитаи роҳсозӣ
1. Кашф: харитаи дрифт, сегментҳо, ченакҳои интиқодӣ ва хатарҳо; Тартибро интихоб кунед (партия/онлайн/PEFT).
2. Мониторинг: PSI/калибрченкунӣ/посбонии тиҷорат; огоҳиҳо ва панелҳо.
3. Мутобиқсозии MVP: равзанаи ғелонда + оғози гарм; канарӣ + худкори бозгашт.
4. Бехатарӣ/- агар лозим бошад, ниқобҳо, FL/DP; гузоришҳои аудиторӣ.
5. Омӯзиши фаъол: Давраи марка бо буҷа ва SLA.
6. Миқёс: сарҳои сегменталӣ/ВМ, буферҳои репетитсионӣ, дистилятсия.
7. Оптимизатсия: PEFT/LORA, ҷадвалҳои аз ҷиҳати хароҷот, мета-омӯзиш, интихоби автоматии триггер.
17) Рӯйхати назоратӣ пеш аз имкон додани мутобиқсозии худкор
- Триггерҳо (PSI/ченакҳо), ҳудудҳо ва тирезаҳо, канали соҳиб ва шиддат муайян карда шудаанд.
- Канария/сояи офлайнӣ ва онлайн вуҷуд дорад; меъёрҳои муҳофизатӣ ва мусоидат ба меъёрҳо.
- Репетиция/дистилятсия/мунтазам ва фаромӯшӣ дохил карда мешаванд.
- Маълумот/вазнҳо/дельтҳои PEFT санҷида мешаванд; Сурати тиреза нигоҳ дошта мешавад.
- Сиёсати махфият/PII ҷорӣ карда шудааст; Дастрасии буферии аудит.
- Буҷа ва маҳдудиятҳои захираҳо; таваққуфи фавқулодда ва худкори бозгашт.
- Ҳуҷҷатгузорӣ: Корти намунавӣ (минтақаи татбиқшавандаи нав), ҳодисаҳои дафтарчаҳо.
18) Қолабҳои хурд (псевдо-YAML/код)
Мутобиқсозии худкори сиёсат
yaml adapt_policy:
triggers:
- type: psi_feature; feature: device_os; threshold: 0. 2; window: 7d
- type: metric_drop; metric: auc; delta: -0. 03; window: 3d mode: warm_start_finetune method:
lora: {rank: 8, alpha: 16, lr: 2e-4, epochs: 1}
rehearsal:
buffer_days: 30 size: 200k guardrails:
min_calibration: ece<=0. 03 worst_segment_auc>=0. 78 rollout: {canary: 10%, promote_after_hours: 6, rollback_on_guardrail_fail: true}
budgets: {gpu_hours_day: 40}
Навсозии онлайн (ангушти калон)
python for batch in stream():
x,y = batch. features, batch. labels loss = model. loss(x,y) + reg_ewc(theta, theta_old, fisher, λ=0. 5)
loss. backward(); clip_grad_norm_(model. parameters(), 1. 0)
opt. step(); ema. update(model); opt. zero_grad()
if t % eval_k == 0: online_eval()
Навбати омӯзишии фаъол
yaml al_queue:
strategy: "entropy"
daily_budget: 3000 sla_labeling_h: 24 golden_checks: true
19) Сатри поён
Омӯзиши мутобиқшавии моделҳо "бозоғозии омӯзиш" нест, балки як схемаи муҳандисӣ аст: муайянкунии драйв → мутобиқшавии бехатар ва иқтисодӣ → санҷиши сифат ва адолат → озодкунии назоратшаванда бо эҳтимолияти лағви фаврӣ. Бо омезиши мониторинг, стратегияҳои PEFT/онлайн, репетиция бар зидди фаромӯшӣ ва посбонҳои қатъӣ, шумо моделҳоеро пайдо мекунед, ки бо маълумот боэътимод тағир меёбанд ва манфиатҳои андозагириро идома медиҳанд.