운영 및 관리 → 변경 관리
관리 변경
1) 목적과 원칙
목표는 신속하고 안전하게 변화를 제공하여 사고, 가동 중지 시간 및 규제 위반의 위험을 줄이는 것입니다.
원칙:- 예측 가능하고 가역적 인: 각 변경 사항은 계획되고 검증 가능하며 가역적입니다.
- 위험 기반: 통제 깊이는 위험 (관할 구역, 돈, PII) 에 따라 다릅니다.
- 작고 빈번한: 작은 증분을 평가하고 롤백하기가 더 쉽습니다.
- 자동화 우선: 코드, 테스트, 검증, 자동 점검과 같은 인프라.
- 진실의 단일 출처: 단일 CC/티켓, 단일 캘린더 및 동작 로그.
2) 범위
제품 코드 (백엔드/프론트 엔드, 모바일 SDK).
인프라 (IaC, Kubernetes/VM/CNC/Edge).
데이터 (DB 다이어그램, 마이그레이션, 상점/ETL).
구성 및 기능 플래그.
통합 (PSP, KYC, 게임 제공 업체).
보안 및 액세스 정책.
3) 역할 및 RACI
책임있는 소유자를 변경하십시오
릴리스 큐레이터/RelEng-릴리스 트레인 조정.
SRE/Ops-SLO/SLA 게이트 운영.
보안/준수-위험 및 준수 검토.
CAB (Change Advisory Board) -정상/고위험 변경 승인.
비즈니스 이해 관계자/지원-정보.
4) 변경 분류
표준 (일반, 사전 승인): 빈번하고 위험이 적으며 기성품 플레이 북 (예: 플래그 업데이트, 키 회전).
일반: RFC, 평가, 가능한 CAB, 테스트 및 롤백 계획이 필요합니다.
긴급 상황: P1 사고에 대한 긴급한 수정; 최소한의 관료적 경로, 사후 검토/SAW.
5) 수명주기 변경
1. 트리거 (RFC): 객관적, 범위, 위험, 영향을받는 서비스/지역, 백 아웃 계획.
2. 위험 평가: 영향 × 가능성 매트릭스, SLO/준수/값에 미치는 영향.
3. 계획: 창, 종속성, 마이그레이션, 커뮤니케이션, 검증 테스트.
4. 검증: 자동 테스트, 정적 분석, 보안 점검, 성능 실행.
5. 배포: 진보적 인 전략 (§ 8 참조), 원격 측정 및 철도.
6. 관찰: 연소율 SLO, 경고, 비즈니스 지표 (GGR/NGR, 변환).
7. 완료: 결과 수락, 문서 업데이트, 편차에 대한 사후 부검.
6) RFC: 최소 구성
맥락: 왜 변화가 가설에 영향을 미칩니까?
범위: 시스템, 지역, 고객 버전.
위험: 매트릭스 및 고장 시나리오, 폭발 반경.
배포 계획: 이동/정지 기준에 따라 단계별로.
백 아웃 계획: 명령/단계, 시작 조건, RTO/RPO 기대.
테스트 계획: 전후 확인 (기능, 성능, 안전).
커뮤니케이션: 우리가 알리는 사람, 메시지 템플릿.
감사: 티켓, 커밋, CI/CD 아티팩트에 대한 링크.
7) 캘린더와 창 변경
단일 캘린더: 모든 릴리스, 마이그레이션, 끄기 기능, 외부 이벤트 (스포츠/마케팅/휴일).
동결 창: 주요 판매/챔피언십/피크 시간, 세금보고.
간섭 정책: 동일한 중요 경로에 대한 상충되는 변경을 방지합니다.
지역 파도: 먼저 "따뜻한" 지역/교통량이 적은 다음 주요 파도.
8) 기술 배포 전략
카나리아: 트래픽의 작은 비율 → 지표 비교 (p95 대기 시간, 오류%, 변환).
청록색: 병렬 환경, 원자 경로 전환.
프로그레시브 배송: 자동 정지 조건이있는 백분율 롤아웃
기능 플래그: 기능 스위치, 킬 스위치, A/B.
어두운 발사/그림자 트래픽: 사용자에게 영향을주지 않고 그림자
단계 제한: QPS/경쟁력의 점진적인 증가.
Gardrails: p95/오류% 임계 값을 초과하면 자동 정지, 반품/요금 지불 증가, 승인/예금 하락.
9) 데이터 및 스키마 변경
호환성: 이전 스키마와 새 스키마를 모두 읽는 추가 마이그레이션 → 코드.
2 단계 마이그레이션: (1) 새 필드/인덱스 → (2) 스위치 코드 → (3) 오래된 것을 추가하십시오.
계약 버전 지정: 레지스트리가있는 Avro/Protomapy 체계; 백/포워드 호환.
대량 마이그레이션: 배치, 일시 정지, demempotency, 체크 포인트 및 진행 상황.
재난 내성: RPO/RTO 테스트, 스냅 샷, 복구 리허설.
BI 데이터: MR/SR 및 메트릭 사전 (ID, formula) 을 통한 쇼케이스/메트릭 변경.
10) 구성 및 비밀 관리
데이터로 설정: verioned configs, 체계에 의한 검증, 환경을 통한 홍보.
비밀: 주요 교체, 최소 권한 원칙, 요청 감사.
지역 오버 라이드: 코드 포크가 아닌 매개 변수화를 통한 제한/파트너 (PSP/KYC).
11) 준수 및 감사 (iGaming 컨텍스트)
변경 사항의 흔적: 전환 한 사람 (플래그, 구성, 경로, 마이그레이션).
직무 분리: 저자, 검토자 및 배포자를위한 다른 역할 (SOX와 유사한).
규제 보고서: 고정 릴리스, 합의 버전 제어 (GGR/NGR, 보너스), PII 액세스 제어.
제공자: 고정 버전의 SDK/제공자 인증서, SLA 의무.
12) 커뮤니케이션
경고 템플릿: 릴리스 전 (언제/위험), (상태,% 트래픽, 메트릭), 이후 (총).
외부 메시지: 고객에게 영향을 줄 때 배너/상태 페이지.
조정: # release-war-room 채널, 릴리스 소유자, 업데이트 빈도.
13) 성능 지표
DORA: 배치 빈도, 변화를위한 리드 타임, 변경 실패율 (CFR), MTTR.
SLO 영향: 릴리스 전/후 SLO의 시간 공유.
백 아웃 속도-변경 범주 별 롤백 빈도.
릴리스 부채: 보류중인 마이그레이션/기능 플래그가 림보로 표시됩니다.
비즈니스 영향: 전환, KYC TTV, 성공률 PSP, 롤링 할 때 GGR/NGR 드리프트.
14) 반 패턴
빅뱅 출시: 한 번에 많은 변화가있었습니다. 회귀의 원인을 이해하기는 어렵습니다.
호환되지 않는 마이그레이션: 이중 읽기없이 필드 삭제/이름 변경
소유자가없는 깃발 및 제거 마감일: "영원한" 논리 분기.
원격 측정 및 정지 기준없이 릴리스합니다: "눈으로" 및 손상의 늦은 감지.
달력 무시: 피크 이벤트/캠페인과의 교차점.
플레이 북 및 감사가없는 수동 단계: 높은 변동성 및 위험.
15) 점검표
시작하기 전에 (RFC 준비)
- 변경 목표 및 KPI가 공식화됩니다
- 위험 및 폭발 반경 평가, 클래스 변경
- 배포 계획 및 백 아웃은 단계별로 작성됩니다
- 무대/카나리아에는 테스트 계획과 결과가 있습니다
- 통신 및 일정 업데이트, 이해 관계자 통지
롤링하는 동안
- p95/오류% 메트릭, 비즈니스 신호 및 로그가 실시간으로 모니터링됩니다
- 진행 단계는 체크 포인트로 확인됩니다
- gardrails의 운영시-자동 정지 및 롤백
후
- 릴리스 결과 기록 (변경, 버전, 아티팩트)
- 편차에 대한 사후 부검 (영업일 5 일)
- 부채 (플래그 삭제, 최종 마이그레이션) 가 소유자와 기록됩니다
16) 미니 템플릿
(PHP 3 = 3.0.6, PHP
목표/가설
범위와 영향 (서비스, 지역, 데이터, 고객)
충격 × 가능성 및 완화 조치
롤링 플랜 (단계,% 트래픽, 이동/이동 금지 기준)
백 아웃 플랜 (단계, RTO/RPO, 데이터)
테스트 계획 (기능/성능/안전)
커뮤니케이션 (채널, 주파수)
아티팩트 (티켓, PR, 빌드 번호)
달력 항목 템플릿:- 변경: "Payments-Service v2. 14 + psp _ 한계 마이그레이션 "
- 창: 2025-11-02 00: 00-01: 00 EET
- 영향을받는 지역: EU, LATAM (10% → 50% → 100%)
- 위험/가드 레일: 오류%> 2% 10 분-정지 및 롤백
- 연락처: @ owner, @ SRE-on-call, @ Support-lead
- 트리거: p95> + 25% 10 분, PSP 성공 <97%
- 단계: (1) v2에서 트래픽 - → 0%. 14; (2) 플래그를 v2로 전환하십시오. 13; (3) 스냅 샷/체크 포인트를 통한 마이그레이션 롤백; (4) 연기 테스트; (5) 보고서.
17) 출시 열차와의 통합
출시 열차: 고정 슬롯 (예: 주당 2 배), 합병시 SLA.
핫픽스 정책: 개별 열차/지점, 빠른 속도로 자극.
버전: 세미나, 아티팩트 및 환경의 레이블, SBOM.
18) 결론
변경 관리는 속도에 대한 브레이크가 아니라 안전한 가속을위한 메커니즘입니다. 위험 기반 분류, 우수한 RFC, 프로그레시브 롤링, 호환 가능한 데이터 마이그레이션, 명확한 통신 및 측정 가능한 효과는 릴리스를 관리 가능하고 반복 가능하며 감사 가능한 프로세스로 전환합니다.