Stratégies de stockage
1) Pourquoi des politiques de stockage sont nécessaires
Les politiques de rétention déterminent combien de temps et pourquoi vous stockez chaque type de données, où elle est hébergée, qui répond et comment les données sont supprimées ou anonymisées. Sans eux, il est impossible de respecter la confidentialité, la minimisation et la reproductibilité des rapports, en particulier dans iGaming avec des IPI/finances sensibles, la réglementation et les enquêtes.
Objectifs :- Conformité avec les lois/licences et les contrats avec les fournisseurs/PSP.
- Minimiser les risques de fuites et d'amendes.
- Prévisibilité des coûts de stockage et des performances de la plate-forme.
- Prise en charge des processus DSAR, Legal Hold, audit et versionalité.
2) Principes de base
1. Stockage ciblé (purpose limitation) : la durée est liée à un objectif de traitement spécifique.
2. Minimisation : ne pas stocker « au cas où » ; à la fin de l'objectif - supprimer/anonymiser.
3. Transparence et probabilité : chaque enregistrement doit avoir un propriétaire, une classe, un terme et un fondement.
4. Séparation des environnements : prod/steads/bac à sable avec différentes durées et ensembles de champs.
5. Policy-as-Code : Stratégie comme configuration dans le référentiel + Validation CI.
6. Defense in Depth : stockage + backups + journaux d'audit + Legal Hold sont cohérents entre eux.
3) Classification et fondement juridique
Classes : Public/Internal/Confidentiel/Restreint (PII/Finance) avec les mots suivants : 'pii', 'financial', 'tokenized', 'backup', 'legal _ hold',' wip ',' dsar _ ject '.
Bases juridiques (exemples) :- Obligation légale/octroi de licences (p. ex. rapports et AML).
- Exécution du contrat (transactions/paiements).
- Intérêt légitime (sécurité, antifrod) - avec évaluation de l'équilibre.
- Consentement (marketing/personnalisation) - avec des délais et des rappels distincts.
4) Matrice de durée de conservation (référence pour iGaming)
5) Legal Hold et gel
Legal Hold annule temporairement les suppressions/TTL pour les trousses liées à l'enquête/au différend.
La source de la vérité est le registre Legal Hold : propriétaire, date, base, gamme de données, date de retrait.
Retrait - selon le processus approuvé ; tous les retraits retardés sont lancés comme des jobs retardés.
6) DSAR et le « droit d'effacement »
Stockez les jetons sujets (et non PII) pour la recherche par graphique.
Maintenir la distinction entre la suppression, la pseudonymisation et l'anonymisation.
Ne pas supprimer les enregistrements qui sont tenus par la loi - marquer la limitation du traitement ; expliquer le sujet.
Dans les backaps, supprimer sur les rotations futures + l'étiquette « subject erased » dans la couche active.
7) Backups, archives et WORM
3-2-1 : trois copies, deux types de médias/nuages, l'une hors ligne/air-gapped.
Cryptage avec des clés KMS/HSM indépendantes du fournisseur.
WORM pour l'audit/rapports réglementaires.
Politique de rotation des backups : la durée de conservation des backups ne doit pas dépasser la durée des données actives, sauf exceptions obligatoires.
Test de restauration programmé.
8) Transfrontalité et géolocalisation
Géo-scoping : les données et les clés de cryptage sont liées à la région/licence.
Les réplications respectent les délais de rétention locaux et les limites de transfert.
Les contrats avec les fournisseurs/PSP/KYC doivent refléter les lieux de stockage et les délais.
9) Architecture de stockage et automatisation
Calques :- Raw/Bronze (durée minimale, sans PII si possible).
- Silver (faits purifiés avec TTL et masquage).
- Gold (agrégats/vitrines de longue durée).
- Feature Store/Model Registry (versioning et time-travel sans PII).
- Lifecycle polices/TTL dans les objets/tables/thèmes.
- Stratégie comme code : YAML/JSON avec 'purpose', 'retaction _ period', 'post _ expiry _ action', 'legal _ hold _ override'.
- CI-linter : bloque le PR si le nouvel ensemble n'a pas de 'retentation _ policy'.
- Scheduler : contrôle quotidien « qui expire demain/semaine ».
- Deletion jobs : Suppression en douceur → vérification des dépendances → suppression/cryptage solide.
10) Suppression, anonymisation, pseudonyme
Hard delete - suppression physique (tenir compte des cascades et de la règle).
Soft delete est l'étiquette 'deleted _ at', cache, plan de la suite hard delete.
Crypto-erase : Supprime les clés d'indisponibilité des données.
L'anonymisation est une transformation irréversible ; le stockage des unités est autorisé.
Pseudonyme - remplacement par des tokens ; la politique clé/pepper et l'interdiction de la réversibilité en dehors de la « zone propre » sont obligatoires.
11) Métriques et SLO
Couverture de rétention :% des jeux avec la stratégie approuvée.
Suppressions en temps réel : proportion des suppressions effectuées à temps.
Zero-PII in Logs : couverture des logs par masquage.
Legal Hold Accuracy : coïncidence du registre avec les gels réels.
Backup Restore-Rate : Succès du test de récupération.
DSAR SLA : délai moyen d'exécution des demandes (par type).
Cost vs Retraite : Économies sur l'agrégation/TTL.
12) RACI (exemple)
Politiques et normes : CDO/DPO (A), Conseil de gouvernement (R/A), Juridique (C), Sécurité (C).
Catalogue et étiquettes : Data Stewards (R), Domain Owners (A), Platform (C).
Automatisation/TTL : Platform/SRE (R), Sec (C).
Legal Hold/DSAR : DPO/Legal (A/R), Domaines (C).
Audit et backup : SecOps/SRE (R), Audit interne (C).
13) Modèles (prêts à l'emploi)
13. 1 Stratégie de stockage (croquis)
Zone : Énumération des domaines et des exceptions.
Motifs : obligation légale/contrat/consentement/intérêt légitime.
Date limite : table 'dataset → period → action'.
Legal Hold : processus d'inclusion/retrait.
DSAR : ordre de recherche/suppression/restriction.
Backups/WORM : délais, clés, test de récupération.
Contrôle : métriques, je rummage annuellement, propriétaire de la politique.
13. 2 Carte de recrutement avec retrait
Dataset: `payments. transactions`
Classe : Restreint (finances)
Fondement : obligation juridique/comptabilité
Durée : N ans à compter de la date de l'opération
Action après le délai : anonymisation des agrégats, suppressions de pièces
Legal Hold override: да
Responsables : Owner/Steward, DPO
Tags/contrats : 'pii', 'tokenized', 'retraite : N', référence de contrat
13. 3 Politique YAML (policy-as-code, fragment)
yaml dataset: payments. transactions purpose: accounting_and_aml class: restricted retention_period: P{N}Y # ISO 8601 duration post_expiry_action: anonymize_then_delete legal_hold_override: true geo_scope: EU backups:
retention_period: P{N}Y worm: true audit:
enabled: true destination: worm://audit/payments
13. 4 Chèque de lancement
- Chaque datacet a une carte et une politique YAML
- Les règles TTL/lifecycle dans les entrepôts sont incluses
- Le catalogue affiche les délais/fondations/propriétaires
- Les alertes d'expiration et le rapport sur la suppression en temps réel sont personnalisés
- Registre Legal Hold synchronisé avec les drapeaux de stockage
- Script « table-top » DSAR/suppression dans les backaps
14) Feuille de route pour la mise en œuvre
0-30 jours (MVP)
1. Inventaire des ensembles et classification ; désigner les propriétaires.
2. Ajouter le champ « retour » au contrat/répertoire ; avoir des cartes de top set.
3. Activer TTL/lifecycle pour les logs et la couche raw ; interdiction des PII dans les loges.
4. Registre de Legal Hold et processus ; rapports de base Coverage/Suppr-time.
30-90 jours
1. Dérouler le policy-as-code (YAML) et le linter CI ; bloc PR sans « retour ».
2. Mettre en œuvre l'anonymisation/pseudonyme de la période postérieure ; automatiser le deletion jobs.
3. Aligner les backaps sur les délais ; activer WORM pour l'audit.
4. Associer le DSAR à la retouche et à la tokénisation ; rapports sur les SLA.
3-6 mois
1. Géolocalisation des jeux et des clés ; les politiques transfrontalières.
2. Analyse avancée des coûts de stockage et de l'effet TTL.
3. Revues trimestrielles des délais avec Legal/Domains ; audit externe.
4. Mise à l'échelle des partenaires/fournisseurs (exigences contractuelles de rétention).
15) Anti-modèles
« Nous gardons tout pour toujours », sans raison ni plan de suppression.
Incohérence : l'actif est supprimé, et dans les backaps - pour toujours.
Absence de Legal Hold : effacement des preuves.
Un seul délai pour tous les domaines « pour simplifier ».
DSAR sans élimination réelle dans les dérivés vitrines/dattes.
Sandbox avec des copies de prod-PII et une durée infinie.
16) Sections connexes
Gestion des données, Contrôle d'accès, Tokenization des données, Sécurité et cryptage, Origine et chemin des données, Audit et versionalité, Legal Hold et DSAR, Confidentiel ML.
Résultat
Les politiques de stockage transforment un « entrepôt chaotique » en une archive gérable : chaque champ connaît sa durée, sa base et son destin. Pour iGaming, c'est la base de la conformité, de l'économie et de la confiance dans les données : vous stockez assez, mais pas trop, vous savez supprimer et prouver rapidement, tout en ne cassant pas les rapports, ML et les processus opérationnels.