Компьютерное зрение в iGaming
1) Зачем CV-пайплайны iGaming-платформе
KYC/AML: OCR документов, проверка подлинности, liveness/anti-spoofing.
Антифрод/риск: детекция ботов/мультиаккаунтов (поведенческое + визуальное), выявление «скрин-шеринга» и прокси-устройств.
Маркетинг/ASO: модерация креативов (текст/символы/рейтинг 18+), бренд-сейфти, A/B визуальных элементов.
Операции/QA: автоматические регресc-тесты UI, визуальная телеметрия лагов/крашей.
Стримы/соцсети: извлечение событий, логотипов, игр/провайдеров, тональности и нарушений.
Responsible Gaming: контроль визуальных коммуникаций (отсутствие агрессивных паттернов для уязвимых групп).
2) Ключевые сценарии и решения
2.1 KYC: документ + лицо
OCR: извлечение ФИО/даты/номера документа, валидация формата, сравнение с заявкой.
Face match: сравнение селфи с фото в документе.
Liveness: пассивные признаки (micro-motion, Moiré, blink) и активные (prompt-challenge).
Подлинность документа: водяные знаки/фонты/микропечать, детекция фотошопа.
2.2 Антифрод и безопасность
Device cam check (где допустимо): признаки воспроизведения с экрана/маски.
Мультиаккаунт: совмещение CV-сигналов (селфи/фон) с поведенческими и графом устройств.
Контент-политики: блокировка изображений платежных карт/паспортов в открытых каналах.
2.3 Маркетинг/креативы/ASO
Модерация: детекция запрещенных символов/слоганов, «18+», QR/ссылок, ставок.
Бренд-сейфти: соответствие гайдам по логотипу, цветам, расположению.
А/Б: автоматический разбор композиции (CTА, контраст, «загруженность»), корреляция с CTR/CR.
2.4 Стримы и видео (игры/eSports/инфлюенсеры)
Logo/Game detection: счетчики промо-показов провайдеров.
Highlight mining: клипы по событиям (большой выигрыш/баг/разрыв соединения).
Модерация видео: Р-рейтинг, азартный контент по часу показа/юрисдикции.
2.5 UI/QA
Визуальная регрессия: сравнение скриншотов по страницам/версиям/устройствам.
Оптическая телеметрия: кадр-тайминги, пропуски рендера, «мигающие» элементы.
Accessibility: проверка контрастности/кегля/alt-текста в креативах и страницах.
3) Архитектуры и развертывание
On-device (мобильные SDK, WebAssembly): мгновенный liveness/OCR без отправки кадров (privacy by default).
Edge (PoP/регион): низкая латентность и гео-изоляция данных/ключей.
Облако: тяжелые модели (детекция, сегментация, видео-анализ), асинхронные задания.
Конфиденциальный инференс: TEE/SGX для VIP/выплат; защищенные конвейеры.
Гибрид: легкая предвалидация на устройстве → точная проверка на edge/облаке.
4) Данные и аугментации
Сбор: согласие, маскировка PII, гео-политики хранения.
Синтетика: генерация документов/селфи с вариациями освещения/угла/шума; domain randomization.
Аугментации: blur, motion, glare, print-scan, экран-на-экран (screen re-capture), JPEG-артефакты.
Баланс: классы «спуф», «фото с экрана», «маска», «мультиэкспозиция» — не реже позитивов.
Разметка: активное обучение; QA-двойная верификация спорных кейсов.
5) Модели и паттерны
Классификация/детекция: YOLOv8/YOLOv9, EfficientDet, ViT/DETR; для логотипов — специализированные детекторы.
Сегментация: SegFormer/Mask2Former (фон/маски, документ-контур).
OCR: TrOCR/ABINet/CRNN + rectification; многоязычная поддержка.
Face: ArcFace/FaceNet для эмбеддингов; Anti-spoof CNN/ViT; liveness по микродвижениям.
Видео: SlowFast/X3D/TimeSformer; для хайлайтов — событийные классификаторы + Energy-based фильтры.
Мультимодальность: CLIP-подобные модели для креативов (изображение+текст).
6) Пайплайны (сквозной вид)
6.1 KYC/Liveness (edge+облако)
1. On-device: кадр-квалификатор (резкость/освещение) → пассивный liveness.
2. Edge: OCR документа, сравнение face-эмбеддингов, спуф-чек; риск-скор.
3. Облако: ручная верификация спорных кейсов (HITL), аудит, DSAR-лог.
6.2 Модерация креативов
1. Ingest креативов (из DAM/админки) →
2. Детекция текста/символов/логотипов →
3. Классификация «allow/flag/deny» по юрисдикциям →
4. API в рекламный движок + отчетность.
6.3 Визуальная регрессия UI
1. Генератор сценариев/скриншотов по устройствам/локалям →
2. Пер-пиксель/пер-объект сравнение + допуски →
3. Алерт в PR/CI; автоснимки до/после.
7) Метрики качества и SLO
Дополнительно: Bias/Fairness по коже/освещению/камере; Privacy (нулевые PII-утечки кадров/логов).
8) Безопасность, приватность и комплаенс
Biometrics-by-design: минимизация/локальность (on-device), шифрование, срок хранения по политике.
Токенизация лицевых эмбеддингов, запрет обратимости, раздельные ключи.
DSAR/удаление: поиск по токену субъекта, криптостирание.
Legal Hold: заморозка видео/кадров для расследований.
Юрисдикции: гео-изоляция данных/ключей, разные правила 18+/рекламы.
Аудит: неизменяемые логи инференса/решений (WORM), объяснимость граничных случаев.
Хитрости злоумышленников: защита от re-capture, adversarial-паттернов, rate limiting.
9) Наблюдаемость и алерты
Онлайн-метрики: latency p50/95/99, error rate, saturations (GPU/CPU/IO).
Качество: drift по освещению/камерам/странам; рост APCER или FPR.
Операционка: очередь спорных кейсов, SLA ручной проверки.
Алерты: всплеск deny-пропусков/ложных срабатываний, падение OCR-точности.
10) Интеграции (API/контракты)
10.1 Сервис KYC
yaml api: /v1/kyc/check request:
selfie: image_token document_front: image_token document_back: image_token country: "EE"
purpose: "account_opening"
response:
scores: {face_match: 0.93, spoof: 0.02}
ocr: {name: "IVAN IVANOV", dob: "1994-02-14"}
decision: "allow manual deny"
trace_id: "..."
privacy: {pii: true, tokenized: true}
10.2 Модерация креативов
yaml api: /v1/creative/moderate request: {image_token: "...", market: "TR", channel: "display"}
response:
violations: ["age_rating_missing","prohibited_text"]
decision: "deny"
trace_id: "..."
11) MLOps для CV
Registry: модель/данные/аугментации/версии; ограничения использования.
Релизы: shadow/canary/blue-green, rollback по FPR/latency.
Тесты: golden-сет с «тяжелыми» кейсами (маски, бликующий пластик, экран-пересъем).
Monitoring: drift лайт-фич (освещенность, резкость), bias-отчеты.
Cost: INT8/FP16, sparsity, batch-size, кэш препроцессинга, роутинг «легкая/тяжелая» модель.
12) Шаблоны (готово к использованию)
12.1 Политика инференса (SLO/Privacy)
yaml cv_service: vision.core slo:
p95_latency_ms: 300 success_rate: 0.995 privacy:
store_frames: false biometrics_tokenized: true retention: "P30D"
monitoring:
spoof_apcer_max: 0.03 ocr_cer_max: 0.06 bias_gap_pp_max: 3
12.2 Чек-лист запуска KYC-модуля
- On-device предвалидация и пассивный liveness включены
- CER/WER на golden-сете ≤ порога
- Bias-отчет по камерам/освещению/типам документов
- Shadow 5–10% заявок, ручная ревизия спорных
- DSAR/удаление и Legal Hold проверены
- Алерты APCER/BPCER и latency
12.3 Runbook «Рост APCER»
1. Проверить дашборд по камерам/странам; определить «горячие» сегменты.
2. Переключить на «тяжелую» модель анти-спуфа на Edge в этих сегментах.
3. Ужесточить пороги, включить активный чек (blink/prompt).
4. Обновить аугментации и golden-сет; пост-мортем.
13) Дорожная карта внедрения
0–30 дней (MVP)
1. KYC: OCR + базовый face-match, пассивный liveness on-device, ручная проверка спорных.
2. Модерация креативов: правила + детектор текста/логотипов; deny-лист по юрисдикциям.
3. UI-регрессия: виз-снимки топ-экранов, PR-гейт по diff%.
30–90 дней
1. Анти-спуф ViT, активные промпты; синтетика документов/селфи.
2. Видео-аналитика стримов: лого/хайлайты; отчеты провайдерам.
3. Отчеты bias/fairness, мониторинг drift; canary-релизы, алерты SLO.
3–6 месяцев
1. Конфиденциальный инференс (TEE) для VIP/выплат.
2. Полноценный контроль бренд-сейфти и A/B креативов с корреляцией на CR/ARPPU.
3. Авто-генерация golden-сетов из спорных кейсов; champion-challenger конфиги.
4. Внешние интеграции с провайдерами/KYC-партнерами по подписанным вебхукам.
14) Анти-паттерны
Хранение «сырых» кадров без нужды и сроков; логи с PII.
Liveness только активный (без пассивного) или наоборот.
Универсальные пороги для всех стран/камер/сцен (игнор сезонности/освещенности).
Отсутствие golden-сета и bias-аудита → «хорошо в среднем, плохо на краях».
Запуск тяжелых моделей без профилирования и бюджетов latency/стоимости.
Модерация креативов «последним шагом» перед релизом — дорого и поздно.
15) Связанные разделы
KYC/AML и контроль доступа, DataOps-практики, MLOps: эксплуатация моделей, API аналитики и метрик, Сентимент-анализ отзывов, Алерты из потоков данных, Этика данных и прозрачность, Политики хранения данных.
Итог
Компьютерное зрение — не «отдельная нейросеть», а часть производственного конвейера данных и рисков: от on-device приватности и гео-изоляции до MLOps и алертов качества. Правильная архитектура CV уменьшает фрод и ручные проверки, ускоряет KYC, делает маркетинг безопасным и измеримым, а продукт — стабильнее и доступнее.