操作和管理→发布和更新周期
发布和更新周期
1)任命
发布周期规定了交付的节奏:更改何时以及如何到达用户,具有哪些质量,速度和透明度保证。设计良好的循环:- 减少不确定性和协调成本,
- 减少事件和回滚的风险,
- 将技术与商业活动(营销,体育,吹风机)同步。报告),
- 在没有CFR(更改失败率)增长的情况下提高团队的通量。
2)发行版型号: 选择哪个
1.发布火车(火车)-固定插槽(例如EET 10:00 wt/cht)。
适用于多组分整体和"重"域变化。
2.Continuous Delivery(根据要求)-通过质量门的每个商品都可以进入跨度。
适合微服务与特色旗文化。
3.混合动力车是火车上的杂货店,"按需"后端服务。
选择标准:测试/观察可用性的成熟度,外部合作伙伴依赖(PSP/KYC),合并要求,组织规模。
3)发布日历和窗口
统一日历:发布时段,DB迁移,营销活动,大型体育赛事,报告期。
Freeze时期:只允许hotfix P1的定义明确的窗口(例如LF结局,黑色星期五,税收报告)。
区域波动:首先是"温暖"的市场/低流量,然后是主要市场;本地TZ的夜间窗口。
交叉政策:禁止同时更改一条关键路径(付款,KYC,授权)。
4)分支和转换
基于trunk+短活的分支机构(分支机构的功能≤ 3-5天)。
释放分支-仅用于火车/长时间验证;"main"中的硬背商品。
SemVer: `MAJOR.MINOR.用于库/SDK的PATCH";工件和环境标签。
合同:具有back/forward兼容性的电路(Avro/Protobuf);迁移是双相的。
5)质量收集器(门)
1.Static+SAST/DAST+linters
2.单位/合同/组件测试
3.E2E/Performance烟雾(在牛排上)
4.安全/合规检查(秘密、许可证、领土政策)
5.Release Candidate →签名,SBOM,工件
6.带自动加德雷尔的渐进式滚动(请参阅第7节)
所有网关均为代码和策略(Policy-as-Code),结果均为发布工件。
6)星期三和促销活动
Dev → Int → Stage → Prod,用于数据:Sandbox/Data-Stage。
GitOps促销活动,immutable图像,禁止销售"手动"编辑。
参数化:区域,限制,提供商-通过configs(可审核的)。
7)推出策略
Canary: 1%→5%→25%→100% (или per-region).
Blue-Green:并行环境+原子开关。
特色旗: 功能夹具/杀手开关;A/B и shadow.
Staged Rollout Mobile/Web:通过客户版本/交付渠道(Store/OTA)。
Gardrails (auto stop): p95 latency ↑> 25%, error%> 2%,授权/存款下降,充电器增长,burn-rate SLO在1小时窗口>阈值。
8)与企业和合作伙伴保持一致
营销/事件:发布的功能与库存活动≥ 48小时。
合作伙伴(PSP/KYC/Game providers): SDK认证/更新的插槽,迁移期间的双重端点。
支持:宏/常见问题解答对UX更改、状态页面、升级通道。
9)数据和模式更新
首先添加:首先添加,然后切换读/写,最后删除旧内容。
索引和大迁徙是夜窗,在蹦床上,带有跳跃和进步。
对店面和字典指标进行验证:更新与发布同步,BI迁移-与销售窗口分开。
10)通信和人工制品
Release Notes(什么/为什么/风险/滚回),ChangeLog按服务。
Stakeholders的日历输入,公告模板(之前/期间/之后)。
列车/主要发行时间的战争室频道,更新频率:P1-每15-20分钟。
11)效率指标
DORA: Deployment Frequency, Lead Time, Change Failure Rate, MTTR.
按更改类型排序。
SLO Compliance在发布之前或之后。
Release Debt:"悬挂"标志,未完成的迁移,旧的依赖关系。
商业影响:转换,KYC TTV,PSP成功,GGR/NGR漂流进入发布窗口。
12)反模式
Big-bang:"一劳永逸",没有旗帜/金丝雀。
在流量/事件高峰时发布,无冻结例外。
没有自动护目镜:手动监控"眼睛"。
长寿分支:痛苦的融合和隐藏的回归。
手动销售步骤:没有审计和可预测性。
没有TTL和所有者的旗帜:"永恒"分支。
13)支票单
发布之前
- RFC/滴答声、风险和 blast-radius被评估
- 通过CI/CD网关,文物签名
- 推出计划+停止标准+backout准备就绪
- 与日历、冻结和合作伙伴保持一致
- Dashbords/Alerts绑定到版本,战争室创建
发布期间
- 金丝雀台阶和自动停止处于活动状态
- 显示器上的p95/error%度量,业务信号(auth、KYC、PSP)
- 时间表通信,状态页面更新
发布后
- Release Notes和ChangeLog已发布
- 删除标志/临时豁免(TTL)
- 背离后的太平间≤ 5名奴隶。日子
- 更新了花花公子和文档
14)迷你模板
发布插槽模板(火车):- 日期/时间:EET上午10点至中午12点
- 县:欧盟(10%→50%→100%),然后是LATAM(10%→100%)
- 停止标准:error%> 2%10 min, p95>+25%10 min, PSP success <97%
- Backout:将流量切换到以前的版本+回滚标志
- 联系人:@RelEng,@SRE-on-call,@Support
- 什么是新事物/为什么
- 对用户和合作伙伴的影响
- 风险和已知的限制
- 推出计划/停止标准/退出
- 用于监控的指标
- 联系方式和支持渠道
15)与邻近学科的整合
变更管理:标准/正常/紧急分类,CAB,审核。
减少事件的影响:现成的幻灯片,配额,shedding。
配置审核:所有促销活动均通过Git, drift细节和应用日志。
执行策略:限制/时间限制/撤回-作为代码,强制执行。
16)结果
发行周期是速度和可靠性之间的可控节奏。需要协调的固定插槽;在自动化成熟的地方"按需"。无处不在-一个日历,旗帜和金丝雀分布,自动花园和透明通信。因此,版本变得可预测,安全且经济。