Modellarni moslashuvchan o’qitish

1) Nega moslashuvchanlik

Dunyo reliz sikllariga qaraganda tezroq o’zgarmoqda. Moslashuvchan o’qitish modellarga to’liq qayta yig’ilmasdan yangi ma’lumotlar/rejimlarga moslashish imkonini beradi: sifatni saqlash, dreyfga javob berish vaqtini qisqartirish va egalik qilish narxini kamaytirish.

Maqsadlar:

Surilganda barqaror sifat source, feature, label, concept.
Oʻzgarishni aniqlash va parametrlarni yangilash orasidagi minimal latentlik.
Nazorat qilinadigan qiymat va xavflar (privacy/fairness/xavfsizlik).

2) Dreyf turlari va signallar

Data (covariate) drift: X taqsimoti oʻzgardi.
Label drift: sinflar chastotasi/labeling-siyosat.

Concept drift: bogʻliqlik P (y	X) o’zgardi (yangi sababiy voqelik).
Context drift: mavsumiylik, kampaniya, regulyator, mintaqa.

Signallar: PSI/JS/KS fichlar bo’yicha, kalibrlash monitoringi, holdout/proksizamerlarda metriklarning tushishi, odam tomonidan overraydlar ulushining o’sishi, shikoyatlar/hodisalarda spaykalar.

3) Moslashuvni ishga tushirish triggerlari

Chegara: PSI> X, p-value <α, kalibrlash sinxronlashtirildi.
Vaqtinchalik: kundalik/haftalik/sirpanish oynalari.
Voqealar: mahsulotning yangi versiyasi, praysing, bozorga chiqish.
Iqtisodiy: cost-to-error/yo’qotishlar ulushi> limit.

Triggerlar policy-as-code sifatida kodlanadi va review oʻtadi.

4) Moslashuvchan ta’lim arxetiplari

1. Batch re-train (deraza bo’yicha qayta o’qitish): sodda va ishonchli; sekin javob beradi.
2. Incremental/online learn: oqimdagi tarozilarni yangilash; bir zumda, lekin unutish xavfi.
3. Warm-start fine-tune: oldingi modelni ishga tushirish, yangi oynada qayta o’rganish.
4. PEFT/LoRA/Adapters (LLM/vektorlar): toʻliq FTsiz tezkor tor yangilanishlar.
5. Distillation/Teacher → Student: arxitektura/domenni oʻzgartirishda bilimlarni koʻchirish.
6. Domain adaptation/transfer: bazisni muzlatish + «bosh» ni nozik sozlash.
7. Meta-learning/Hypernets: kichik misollar bilan qayta o’qitishni tezlashtiradi.
8. Bandits/RL: muhitga javob berish uchun siyosatni moslashtirish.
9. Federated learning: xom ma’lumotlarni olib chiqmasdan personallashtirish.

5) Ma’lumotlar rejimlari bo’yicha strategiyalar

Striming: online-optimizatorlar (SGD/Adam/Adagrad), EMA tarozilar, sirpanuvchi derazalar, anti-unutish uchun rehearsal-bufer.
Mikro-batchi: muntazam mini-fit (soat/kun), validatsiya bo’yicha early-stop.
Batch derazalari: domen bo’yicha rolling 7/14/30d, noyob sinflar uchun stratifikatsiya.
Few-shot: PEFT/Adapters, prompt-tuning, retrieval-ilova LLM uchun.

6) Halokatli unutishni nazorat qilish

Rehearsal (oʻtmishdagi maʼlumotlarning tayanch namunasi).
Regularization: EWC/LwF/ELR - avvalgi muhim narsalardan voz kechganlik uchun jarima.
Distillation: Langar maʼlumotlari boʻyicha oldingi modelga KLD.
Mixture-of-Experts/condition on context: segmentlar bo’yicha turli mutaxassislar.
Freeze- & -thaw: Bazisni muzlatish, yuqori qatlamlarni qayta oʻrganish.

7) Personallashtirish va segmentlashtirish

Global + Local heads: umumiy baza, segmentga «boshlar» (mintaqa/kanal/VIP).
Per-user adapters/embeddings: foydalanuvchi uchun oson xotira.
Kontekst bo’yicha Gating: trafikning eng yaxshi ekspertga (MoE/routers) yo’nalishi.
Fairness-gvardlar: shaxsiylashtirish guruhlar bo’yicha tenglikni yomonlashtirmasligiga ishonch hosil qiling.

8) Active Learning (konturdagi odam)

Belgilash strategiyasi: maksimal noaniqlik, margin/entropy, core-set, disagreement committee.
Budjetlar va muddatlar: belgilash uchun kunlik kvotalar, javobning SLA.
Belgilarni qabul qilish: annotatorlarning roziligini nazorat qilish, kichik oltin testlar.
Siklning yopilishi: yangi haqiqiy belgilarda darhol qo’shimcha o’qish.

9) Optimallashtiruvchilar va jadvallarni tanlash

Online: decay, clip-grad, EMA parametrlari bilan Adagrad/AdamW.
Schedules: cosine restarts, one-cycle, warmup→decay.
Jadvallar uchun: incremental GBDT (daraxtlarni yangilash/daraxtlarni qoʻshish).
LLM uchun: past lr, vazifaga muvofiq LoRA rank, reglament bo’yicha sifatni nazorat qilish.

10) Moslashish uchun ma’lumotlar

Onlayn bufer: yangi ijobiy/salbiy seyslar, sinflar balansi.
Reweighting: importance weighting при covariate drift.
Hard-examples mining: jiddiy xatolar ustuvor hisoblanadi.
Data contracts: sxemalar/sifat/PII niqoblar prod-oqim uchun bir xil.

11) Moslashuv rejimida sifatni baholash

Pre-/Post-lift: A/B yoki talqin qilinadigan kvazi-eksperiment.
Rolling validation: vaqtinchalik splitlar, out-of-time test.
Guardrails: kalibrlash, toxicity/abuse, xavfsiz ishonch chegaralari.
Worst-segment tracking: nafaqat o’rta segment, balki eng yomon segment monitoringi.
Staleness KPI: oxirgi muvaffaqiyatli moslashuvdan keyingi vaqt.

12) MLOps: jarayon va artefaktlar

Model Registry: versiya, sana, ma’lumotlar oynasi, xesh fichlar, giperlar, artefaktlar (PEFT).
Data Lineage: manbalardan feature store gacha; o’qitish kesmalarini muzlatish.
Pipelines: DAG для fit→eval→promote→canary→rollout, с auto-revert.
Shadow/Canary: haqiqiy trafikdagi prod-versiyaga qarshi taqqoslash.
Observability: latency/cost, drift, fairness, safety, override-rate.
Release policy: «promote» ni kim va qaysi metriklarda bosadi.

13) Xavfsizlik, maxfiylik, huquqlar

PII minimallashtirish va niqoblash, ayniqsa oqim buferlarida.
Privacy-preserving moslashuvi: FL/secure aggregation, sezgir domenlar uchun DP-kliplar/shovqinlar.
Etika: yuqori tavakkalchilik yechimlarida avtoadapt taqiqlari (inson-in-the-loop majburiy).
Bilimlarni begonalashtirish: distillatsiya/o’rnatiladigan tuzoq kalitlari orqali oqishni nazorat qilish.

14) Iqtisodiyot va SLO moslashuvlar

SLA yangilanishlari: masalan, TTA (time-to-adapt) ≤ drift paytida 4 soat.
Budget guardrails: GPU-soat/sutka limitlari, egress/saqlash uchun cap.
Cost-aware siyosati: tungi derazalar, tanqidiy modellarning ustuvorligi, to’liq FT o’rniga PEFT.
Kesh/retriver: LLM uchun - to’liq o’rganmasdan groundedness ko’paytiramiz.

15) Antipatternlar

«Har doim va hamma joyda o’qish»: nazoratsiz online-fit → tubsizlik.
rehearsal/regularization yo’qligi: halokatli unutish.
offline/online eval: «koʻzga» relizlari yoʻq.
Shikoyatlar/apellatsiyalarda qayta o’qitish: tajovuzkorlar tomonidan qayta aloqadan foydalanish.
Domenlarni aralashtirish: routingsiz turli segmentlar uchun yagona model.
Yo’naltiriluvchanlik nol: qayta o’qitilgan narsalarni takrorlab bo’lmaydi.

16) Joriy etish yo’l xaritasi

1. Discovery: dreyf xaritasi, segmentlar, tanqidiy metriklar va xavflar; modini tanlang (batch/online/PEFT).
2. Monitoring: PSI/kalibrlash/biznes-guardrails; alertlar va panellar.
3. MVP-moslashuv: rolling window + warm-start; canary + auto-revert.
4. Xavfsizlik/priv: niqoblar, zarurat bo’lganda FL/DP; log auditi.
5. Active Learning: budjet va SLA bilan belgilash halqasi.
6. Scale: segmentli boshlar/MoE, rehearsal-buferlar, distillash.
7. Optimizatsiya: PEFT/LoRA, cost-aware jadvallari, meta-o’qitish, triggerlarni avtomatik tanlash.

17) Avtoadaptatsiyani yoqishdan oldingi chek-varaq

Triggerlar (PSI/metriklar), ostona va derazalar, owner va eskalatsiya kanali aniqlangan.
offline eval va onlayn canary/shadow mavjud; guardrail-metrika va promote mezonlari.
rehearsal/distillation/unutishga qarshi tartiblash yoqilgan.
Ma’lumotlar/og’irliklar/PEFT-delta versiyalari; window snapshot saqlanmoqda.
Privacy/PII siyosati qo’llanildi; buferlardan foydalanish auditi.
Resurslarning budjetlari va limitlari; avariya holatida to’xtash va auto-rollback.
Hujjatlar: Model Card (yangilangan qoʻllanish zonasi), runbooks hodisalari.

18) Mini-shablonlar (psevdo-YAML/kod)

Avtoadaptatsiya policy

yaml adapt_policy:
triggers:
- type: psi_feature; feature: device_os; threshold: 0. 2; window: 7d
- type: metric_drop; metric: auc; delta: -0. 03; window: 3d mode: warm_start_finetune method:
lora: {rank: 8, alpha: 16, lr: 2e-4, epochs: 1}
rehearsal:
buffer_days: 30 size: 200k guardrails:
min_calibration: ece<=0. 03 worst_segment_auc>=0. 78 rollout: {canary: 10%, promote_after_hours: 6, rollback_on_guardrail_fail: true}
budgets: {gpu_hours_day: 40}

Online-yangilash (eskiz)

python for batch in stream():
x,y = batch. features, batch. labels loss = model. loss(x,y) + reg_ewc(theta, theta_old, fisher, λ=0. 5)
loss. backward(); clip_grad_norm_(model. parameters(), 1. 0)
opt. step(); ema. update(model); opt. zero_grad()
if t % eval_k == 0: online_eval()

Active Learning navbati

yaml al_queue:
strategy: "entropy"
daily_budget: 3000 sla_labeling_h: 24 golden_checks: true

19) Jami

Modellarni moslashuvchan o’qitish «mashg’ulotlarni qayta boshlash» emas, balki muhandislik konturidir: drift deteksiyasi → xavfsiz va tejamkor moslashuv → sifat va adolatni tekshirish → tezda qaytarish imkoniyati bilan nazorat qilinadigan reliz. Monitoring, PEFT/onlayn strategiyalar, rehearsal unutishga qarshi va qat’iy gardrails orqali siz ma’lumotlar bilan ishonchli o’zgaradigan va o’lchovli foyda keltiradigan modellarni olasiz.

Modellarni moslashuvchan o’qitish

Online-yangilash (eskiz)

Active Learning navbati

Biz bilan bog‘laning

Tez aloqa

Video tez orada yangilanadi

Hozir loyihalar bilan juda bandmiz