GH GambleHub

خطوط أنابيب الذكاء الاصطناعي وأتمتة التدريب

1) الغرض والمبادئ

الغرض: موثوق به ومستنسخ لتحويل سمات → البيانات → نماذج → قرارات → تعليقات، مع الحد الأدنى من الوقت إلى القيمة والتحكم في المخاطر/التكاليف.

المبادئ:
  • خط الأنابيب كرمز: كل شيء (DAG، التكوينات، الاختبارات، السياسيون) - في Git، من خلال العلاقات العامة والمراجعة.
  • الحتمية: الإصدارات الثابتة من البيانات/الرموز/الحاويات/التبعيات.
  • فصل المخاوف: DataOps و FeatureOps و TrainOps و PospoyOps و MonitorOps.
  • الأتمتة المحروسة: نقوم بالأتمتة، ولكن مع «بوابات» الجودة والسلامة والامتثال.
  • الخصوصية حسب التصميم: تقليل PII، الإقامة، التدقيق.

2) طبقات النقل والهندسة المعمارية

1. Inster & Bronze: استقبال موثوق للأحداث/الدفعات (CDC، إطارات، retrays، DLQ).
2. الفضة (التطبيع/التخصيب): SCD، العملات/الوقت، المقاصة، التخلص.
3. الذهب (واجهات المحلات): جداول مواضيع ومجموعات بيانات للتدريب/الإبلاغ.
4. متجر الميزات: صيغ موحدة للميزات والإصدارات و SLO عبر الإنترنت/غير متصل بالإنترنت.
5. التدريب والتحقق: إعداد العينات والتدريب والمعايرة والتقييم/التحقق من البوابات.
6. السجل والترويج: سجل النماذج، وبطاقات الجودة، وسياسة الترويج.
7. التقديم: REST/gRPC/Batch، مخابئ مميزة، أعلام مميزة، كناري/ظل.
8. المراقبة والتعليقات: SLI/SLO، الانجراف/المعايرة، الملصقات عبر الإنترنت، إعادة التدريب التلقائي.


3) التنسيق: أنماط DAG

Daily CT (D + 1): دورة البيانات الليلية → السمات → التدريب → التحقق → المرشح للسجل.
Retrain المدفوع بالحدث: إطلاق PSI/ECE/الانجراف متوقع التكلفة أو إطلاق الدائرة.
Rolling Windows: إعادة تدريب أسبوعية/شهرية مع «نافذة منزلقة» من البيانات.
القطع الأثرية الزرقاء/الخضراء: جميع القطع الأثرية ثابتة (التجزئة)، إصدارات متوازية.
مزدوج الكتابة v1/v2: مخطط/ميزة الهجرات من خلال الكتابة المزدوجة ومقارنة التكافؤ.

مثال تدفق الهواء (صورة مصغرة):
python with DAG("ct_daily", schedule="@daily", start_date=..., catchup=False) as dag:
bronze = BashOperator(task_id="ingest_cdc", bash_command="ingest.sh")
silver = BashOperator(task_id="silver_norm", bash_command="dbt run --models silver")
gold  = BashOperator(task_id="gold_marts", bash_command="dbt run --models gold")
feats = BashOperator(task_id="feature_store_publish", bash_command="features publish")
ds   = BashOperator(task_id="build_dataset", bash_command="dataset build --asof {{ ds }}")
train = BashOperator(task_id="train", bash_command="trainer run --config conf.yaml")
eval  = BashOperator(task_id="evaluate", bash_command="eval run --gate conf/gates.yaml")
reg  = BashOperator(task_id="register", bash_command="registry add --stage Staging")
bronze >> silver >> gold >> feats >> ds >> train >> eval >> reg

4) مجموعات البيانات والعينات

انضم في الوقت المناسب و «لا مستقبل» للميزات/الملصقات.
طبقي حسب الأسواق/المستأجرين/الوقت، والمنع و «الفجوة» للتسريبات.
نسخة: «data _ version», «logic _ version», «asof _ date»; لقطات WORM.


5) متجر الميزات والتكافؤ عبر الإنترنت/غير متصل بالإنترنت

تحديد موحد للميزات (الاسم، الصيغة، المالك، SLO، الاختبارات).
عبر الإنترنت = غير متصل بالإنترنت: رمز التحويل المشترك ؛ اختبار التكافؤ (MAE/MAPE).

TTL و cache: نوافذ 10 م/1 ساعة/1 د ؛ والإجازات/التراجعات ؛ Folbacks' last_known_good. "

Speca fici (YAML):
yaml name: bets_sum_7d owner: ml-risk offline: {source: silver.fact_bets, window: "[-7d,0)"}
online: {compute: "streaming_window: 7d", ttl: "10m"}
tests:
- compare_online_offline_max_abs_diff: 0.5 slo: {latency_ms_p95: 20, availability: 0.999}

6) أتمتة التدريب (CT) وبوابات الجودة

دورة الأشعة المقطعية: الإعداد → التدريب → المعايرة → التقييم → تسجيل المرشح.

بوابات (مثال):
  • خارج الشبكة: المؤشر المرجعي لمفوضية الاتحاد الأفريقي ≥ − δ; اللجنة الاقتصادية لأوروبا ≤ 0. 05; ≤ الحد الأقصى المتوقع للتكلفة.
  • شريحة/عدالة: انخفاض في المقاييس في أي شريحة ≤ Y٪ ؛ التأثير المتباين طبيعي.
  • ميزة التكافؤ: تقريبًا.
  • التكلفة: الوقت/الموارد ≤ الميزانية.
بوابات التكوين (YAML):
yaml gates:
pr_auc_min: 0.42 ece_max: 0.05 expected_cost_delta_max: 0.0 slice_drop_max_pct: 10 features_equivalence_p95_abs_diff_max: 0.5

7) السجل النموذجي والترويج

بطاقة الطراز: البيانات والنوافذ والميزات والمقاييس خارج/عبر الإنترنت والمعايرة والمخاطر والمالك.
Stages: 'Staging → Production → Archited'; فقط من خلال بوابات مثبتة.
سياسة التراجع: مواصلة ≥N أحدث إصدارات الإنتاج ؛ نقرة واحدة للتراجع.


8) CI/CD/CT: كيفية الربط

CI (رمز/اختبارات): اختبارات الوحدة/التكامل/العقد، البطانات، الفحوصات الأمنية.
CD (خدمة): أعلام Docker/K8s/Helm/feature، كناري/ظل/أزرق أخضر.
CT (بيانات/تدريب): منظم الجدول الزمني/المناسبات ؛ القطع الأثرية → التسجيل.
Promotion Gates: auto-release in production with green online SLO (on canary ≥ X hours).


9) تعدد الإيجارات والإقامة

المستأجرون/المناطق: خطوط الأنابيب المعزولة ومفاتيح التشفير (EEA/UK/BR) ؛ وحظر الانضمام الأقاليمي دون سبب.
الأسرار: KMS/CMK، مدير سري ؛ معرفات رمزية في جذوع الأشجار.
سياسات نظام DSAR/RTBF: إسقاطات قابلة للحساب وتعديلات انتقائية في الخصائص والسجلات ؛ انتظار قانوني للقضايا.


10) رصد التغذية المرتدة → → إعادة التدريب

SLI/SLO: latency p95/p99, 5xx, community, cost/request; التكلفة المتوقعة لمبادرة خفض الانبعاثات الناجمة عن الانحراف/KL، اللجنة الاقتصادية لأوروبا.
الملصقات عبر الإنترنت: الوكيل (ساعة/يوم) والتأخير (D + 7/D + 30/D + 90).
الإجراءات الذاتية: تحديث إعادة المعايرة/العتبة → إعادة تدريب الظل → ترويج → الكناري.
دفاتر التشغيل: سيناريوهات التحلل (الانجراف، المعايرة، ذاكرة التخزين المؤقت، مقدمو الخدمات).


11) الأمن، RG/AML وسياسة الحلول

حواجز الحماية: المرشح المسبق/اللاحق، ترددات الأغطية، التهدئة، قوائم الحظر.
Policy Shielding - Model → Solution → Policy Filter → Action.
مراجعة الحسابات: 'model _ id/version', 'feature _ version', 'thrhold', 'policy _ id', reasons.
أرشيف WORM: الإصدارات، تقارير الجودة، سجلات الاختبار/الترويج.


12) التكلفة والأداء

توصيف المسار: ميزات (30-60٪)، استنتاج (20-40٪)، IO/الشبكة.
لوحات التحكم في التكاليف: التكلفة/الطلب، التكلفة/الميزة، وحدة معالجة الرسومات/وحدة المعالجة المركزية - الساعة، الملفات الصغيرة.
التحسين: تجسيد الميزات الثقيلة غير المتصلة بالإنترنت، ومخبأ النوافذ الساخنة، INT8/FP16، وحصص إعادة التشغيل/الردم.
رد التكاليف: نوزع الميزانية حسب الفريق/السوق، ونتحكم في الميزات «باهظة الثمن».


13) أمثلة (شظايا)

سير عمل Argo:
yaml apiVersion: argoproj.io/v1alpha1 kind: Workflow metadata: {name: ct-daily}
spec:
entrypoint: pipeline templates:
- name: pipeline dag:
tasks:
- name: gold template: task arguments: {parameters: [{name: cmd, value: "dbt run --models gold"}]}
- name: features dependencies: [gold]
template: task arguments: {parameters: [{name: cmd, value: "features publish"}]}
- name: train dependencies: [features]
template: task arguments: {parameters: [{name: cmd, value: "trainer run --config conf.yaml"}]}
- name: eval dependencies: [train]
template: task arguments: {parameters: [{name: cmd, value: "eval run --gate conf/gates.yaml"}]}
- name: task inputs: {parameters: [{name: cmd}]}
container: {image: "ml/ct:latest", command: ["/bin/bash","-lc"], args: ["{{inputs.parameters.cmd}}"]}
نص البوابة (كاذب):
python ok = (pr_auc >= gate.pr_auc_min and ece <= gate.ece_max and expected_cost_delta <= gate.expected_cost_delta_max and slice_drop_pct <= gate.slice_drop_max_pct and features_equivalence_p95_abs_diff <= gate.features_equivalence_p95_abs_diff_max)
exit(0 if ok else 1)
سياسة الترويج (فكرة):
yaml promotion:
require:
- offline_gates_passed
- canary_online_hours >= 24
- slo_green: [latency_p95, error_rate, coverage]
- drift_warn_rate <= 5%

14) العمليات و RACI

R (مسؤول):
  • Data Eng - Inster/Silver/Gold، Feature Store، CDC/Backfill ؛
  • علم البيانات - العينات/التدريب/المعايرة/البوابات ؛
  • MLOps - orkestration/reestr/serving/nablyudayemost.
  • ألف (مسؤول): رئيس قسم البيانات/المدير التنفيذي.
  • جيم (استشاري): الامتثال/إدارة الشؤون السياسية (PII/RG/AML/DSAR)، الأمن (KMS/Audit)، SRE (SLO/Value)، التمويل (الميزانيات/العائد على الاستثمار)، المنتج.
  • I (مطلع): التسويق/العمليات/الدعم.

15) خارطة طريق التنفيذ

أفضل لاعب (3-6 أسابيع):

1. DAG «daily CT»: Bronze→Silver→Gold→Feature Store→Train→Eval→Registry (Staging).

2. ميزة متجر v1 واختبار التكافؤ عبر الإنترنت/غير متصل بالإنترنت.

3. بوابات الجودة (PR-AUC/ECE/التكلفة المتوقعة/الشريحة).

4. سجل النماذج والبطاقات وأرشيف إصدار WORM.

المرحلة 2 (6-12 أسبوعاً):
  • تحديث إعادة المعايرة التلقائية/العتبة، ترويج الكناري عبر SLO عبر الإنترنت.
  • إعادة التدريب بواسطة الحدث عن طريق الانجراف ؛ مزدوج الكتابة v1/v2 للهجرات.
  • لوحات متابعة التكاليف وحصص التعبئة/إعادة التشغيل ؛ العزلة المتعددة المستأجرين.
المرحلة 3 (12-20 أسبوعاً):
  • سياسات الإنصاف بشأن الشرائح والإبلاغ التلقائي.
  • الإقامة متعددة المناطق (EEA/UK/BR) مع مفاتيح فردية.
  • إعادة التدريب التلقائي حسب الجدول الزمني والأحداث، التوثيق التلقائي لخطوط الأنابيب.

16) قائمة التسليم المرجعية

  • خط الأنابيب كرمز в Git ؛ اختبارات CI (الوحدة/التكامل/العقود/الأمن).
  • المتجر البرونزي/الفضي/الذهبي والميزات مستقرة ؛ ميزة التكافؤ الأخضر.
  • مرت بوابات غير متصلة بالإنترنت ؛ البطاقة النموذجية ممتلئة ؛ تم إنشاء أرشيف WORM.
  • كناري ≥ 24 ساعة مع SLOs خضراء ؛ زر التراجع ووظيفة تبديل القتل.
  • تم التمكين من رصد الانحراف/اللجنة الاقتصادية لأوروبا/التكلفة المتوقعة والعلامات الإلكترونية.
  • PII/residency/DSAR/RTBF/Legal Hold ؛ شكلت مراجعة الحسابات.
  • التكلفة في الميزانية ؛ المخبأ/الحصص/الميزة وحدود إعادة التشغيل نشطة.

17) الأنماط والمخاطر المضادة

كتيب، خطوات «طلقة واحدة» خارج المنسق ؛ لا قصة جيت.
التدريب بدون بوابات وبطاقات ؛ الترقية «باليد».
ميزات غير متسقة عبر الإنترنت/غير متصلة بالإنترنت → التناقضات المعروضة للبيع.
تجاهل الانجراف/المعايرة/التكلفة المتوقعة ؛ ROC-AUC «لكل نوع» فقط.
الافتقار إلى سياسات الإقامة/المبادرة ؛ تسجيل الهوية «الخام».
ردم/إعادة ردم غير محدود → انفجار التكلفة والتأثير على جيش تحرير السودان.


18) خلاصة القول

خطوط أنابيب الذكاء الاصطناعي هي خط أنابيب ذو قيمة، وليست مجموعة من أجهزة الكمبيوتر المحمولة. إضفاء الطابع الرسمي على طبقات البيانات ومتجر الميزات و CT/CI/CD، وإضافة بوابات الجودة والسلامة، وأتمتة إعادة التدريب عن طريق الانجراف، والحفاظ على التكافؤ عبر الإنترنت/بدون اتصال بالإنترنت واقتصاد شفاف. يمنحك هذا نموذجًا سريعًا ومتوقعًا ومتوافقًا → البيانات → دورة تأثير تتسع عبر الأسواق والوقت.

Contact

اتصل بنا

تواصل معنا لأي أسئلة أو دعم.نحن دائمًا جاهزون لمساعدتكم!

بدء التكامل

البريد الإلكتروني — إلزامي. تيليغرام أو واتساب — اختياري.

اسمك اختياري
البريد الإلكتروني اختياري
الموضوع اختياري
الرسالة اختياري
Telegram اختياري
@
إذا ذكرت تيليغرام — سنرد عليك هناك أيضًا بالإضافة إلى البريد الإلكتروني.
WhatsApp اختياري
الصيغة: رمز الدولة + الرقم (مثال: +971XXXXXXXXX).

بالنقر على الزر، فإنك توافق على معالجة بياناتك.