加强项目环境和审计
1)目标及责任范围
生产不仅是"最稳定的环境",而且是最受攻击的环境。我们的任务是:- 最大限度地减少攻击面积和Blast Radius;
- 保护供应渠道、记录、秘密和文物;
- 以更快的MTTR目标检测和响应事件;
- 确认法规遵从性(GDPR/PCI DSS/本地规则);
- 保持所有关键活动的可验证性(可审核性)。
关键原则是:零信托,Least Privilege,Segmentation,所有代码,安全默认。
2)网络周长和细分
片段:边缘(WAF,机器人管理,DDoS),DMZ(网关),App(微服务),数据(DB/缓存),Backoffice/Ops(CI/CD,观察力)。
策略L4/L7:deny-by-default,按服务/neyspace/端口进行显式allow。
群集中的mTLS;TLS 1.外围2+,HSTS,安全密码。
输入过滤器:WAF(OWASP Top-10),反机器人,rate限制,地理/ASN块,CAPTCHA到风险路径。
DDoS保护:alway-on+auto-mitigation,用于API/静态内容的单独配置文件。
Egress控制:仅提供商所需的外部主机(PSP/KYC/游戏)。
3)身份,访问和特权(IAM/PAM)
个人的SSO(OIDC/SAML)+MFA;OIDC令牌/服务工作负载身份。
RBAC/ABAC:具有最低所需权限的角色;在审核和TTL下访问"断面玻璃"。
PAM:按需写出特权会议,完整记录和日志记录。
CIEM(云):寻找过多的权利和死角,自动重塑。
Prod数据访问:仅通过已批准的jump/代理,并带有PII掩码。
4)秘密和密码学
KMS/HSM:密钥存储,envelope加密,带通知的旋转。
秘密管理员:短寿命信条,从Git/Logs中排除秘密。
标题:工件(cosign),webhooks(HMAC),服务令牌。
PAN/PII字段:标记/加密;在日志和预览中掩盖。
轮换策略:按键/证书/密码-法规和强制执行。
5)容器和Kubernetes(CWPP/KSPM)
基本图像:CI上的最小漏洞扫描;rootless是可能的。
管理政策(OPA/Gatekeeper/Kyverno):禁止":最新","特权",hostPath;我们需要图像签名。
NetworkPolicies:仅根据需要进行服务间通信。
PodSecurity:有限的资本,只读的FS, seccomp, AppArmor。
秘密:来自秘密商店CSI(KMS);宣言中没有一个平面的秘密。
运行时保护:行为规则(eBPF),异常异常。
rego package k8sadmission deny[msg] {
input. request. kind. kind == "Pod"
some c image:= input. request. object. spec. containers[c].image not startswith(image, "registry. company. com/signed/")
msg:= sprintf("Image must be signed and come from trusted registry: %v", [image])
}
6)供应链: 信任,但要检查
每张钞票的SBOM;存储和链接到发行版。
映像/清单签名,在admission控制器中进行验证。
SLSA认证:文物的可证明来源。
Policy-as-Code:Merge之前Terraform/Helm/K8s的Conftest/OPA。
禁止在销售上进行"最后一分钟修补":所有更改仅通过管道进行。
7)漏洞和修补程序管理
SCA/SAST/DAST в CI;临界/高的锁定阈值。
每周更新(映像、OS包、库)+紧急计划外。
已执行的修补程序→带有CVE/SBOM绑定的字幕/发行版。
EASM:攻击表面的外部概述(子域,打开的端口,证书)。
定期泡沫测试:每年至少一次+按关键流量(付款/CUS)计费。
8)审计工件的逻辑、度量、跟踪和存储
带有"trace_id","request_id",用户/tenant/geo(别名)的标准化逻辑(JSON),没有PII/PAN。
度量标准:p50/p95/p99,error-rate,aturation,DLQ,retrai,Business KPI(时间到钱包)。
Tracing (OTel):关键路线的终端(存款/KUS/输出)。
SIEM:事件相关性(身份验证,角色更改,管理操作,WAF/机器人规则)。
SOAR:自动反应(poda隔离,令牌召回,IP/ASN单元,发布禁令)。
重组:根据策略,操作逻辑-30-90天的热存储,审核工件-更长。
json
{
"ts":"2025-11-05T15:00:00Z",
"sev":"WARN",
"svc":"payments-api",
"route":"POST /v1/payments",
"trace_id":"2f9f...e1",
"user":"anon",
"tenant":"eu-casino-12",
"geo":"EU",
"event":"circuit_breaker_open",
"provider":"psp-1"
}
9)反机器人,欺诈和保护方案
机器人管理:签名/行为,设备指纹,动态挑战。
Rate limits/quotas: per-user/tenant/IP;适应异常。
关键尾端上的RASP传感器(尝试绕过webhooks签名,时钟漂移,重新交付)。
Fraud信号:通道相关性(登录、支付、KYC),自动升级。
10)冗余,DR和BCP
RTO/RPO目标已定义和测试(例如,RTO ≤ 1小时,RPO ≤支付DB的5分钟)。
Backaps:加密,定期在离线存储中;定期还原测试。
地理重复:按地区划分的资产/资产;具有TTL控制的DNS失败。
关键依赖性目录(PSP/KYC/游戏聚合器)和切换计划。
11)事件和反应
Runbooks:用于提供商下降,潜伏期增加,令牌损害,DDoS。
呼叫时间:24/7,旋转和爆破页;协作的"战争室"练习。
通讯:向客户/合作伙伴和监管机构发送消息的模板。
后遗症(blameless):防止重复的行动,更新策略/花花公子。
12)合规与隐私
GDPR:数据最小化,同意寄存器,删除/移植权;新提供商的DPIA。
PCI DSS:标记/隔离PAN区域,网络段,严格的访问日志。
本地要求(市场管辖区):存储区域数据、报告、更新窗口。
数据线:PII/PAN在何处和如何流动;DevPortal中的电路和DPIA。
13)审核: 类型、工件和周期
审计类型:- 内部(季度):遵守政策,控制更改,访问,保密,标志,piplines。
- 外部(每年/按要求):PCI/GDPR/本地调节器,泡沫测试,SOC提供商报告。
- 安全策略、IAM角色矩阵、异常列表以及到期日期。
- 基础架构更改逻辑(IaC),CI/CD报告(SBOM,签名,测试)。
- 提供商注册表(PSP/KYC/游戏),DPIA/供应商风险评估,合同和SLA。
- Prod访问日志,秘密轮换结果,SIEM/SOAR报告。
- DR/BCP计划和最新恢复测试协议。
- "Evidence-first":每种做法都是可验证的工件。
- "Prod中没有人":最多通过管道和批准的申请;所有会议都在日志下。
- "Trace everything":将更改与事件/度量相关联。
14) Guardrails-as-Code: 示例
Terraform的Conftest(禁止公共DB):rego package terraform. deny deny[msg] {
input. resource. type == "aws_db_instance"
input. resource. publicly_accessible == true msg:= "RDS must not be public"
}
AdmissionPolicy (K8s): 我们要求安全标签和资源限制
yaml apiVersion: kyverno. io/v1 kind: ClusterPolicy metadata:
name: enforce-security-labels-and-limits spec:
rules:
- name: require-labels match: {resources: {kinds: ["Deployment","StatefulSet"]}}
validate:
message: "security labels required"
pattern:
metadata:
labels:
security. tier: "?"
data. classification: "?"
- name: require-limits match: {resources: {kinds: ["Deployment","StatefulSet"]}}
validate:
message: "resources limits/requests required"
pattern:
spec:
template:
spec:
containers:
- resources:
limits:
cpu: "?"
memory: "?"
requests:
cpu: "?"
memory: "?"
15)每日卫生检查清单-周三
- WAF/机器人策略处于活动状态,签名已更新;反DDoS在永远模式。
- 群集中的管理控制器处于强制状态,不进行审核。
- 所有程序映像均已签名;SBOM可用并绑定到发行版。
- Critical/High漏洞-缺少或记录了日期异常。
- 保密/证书轮换-如期,没有延迟。
- SIEM与IAM/发行版的登录/更改事件相关;SOAR花花公子正在测试中。
- Bacaps通过了时间表,还原测试;DR计划验证。
- 仅通过SSO+MFA/PAM进入插件;所有会议都记录下来。
- "No PII in logs"-由扫描仪验证;已启用掩码。
- Release gates和可观察性已更新"as-code"。
16)成熟度模型(简述)
1.基本是手动更改,单一周长,部分监视。
2.高级细分,IAM/RBAC,签名工件,WAF/DDoS,SIEM,定期补丁。
3.专家-零信托,guardrails-as-code,SLSA认证,运行时保护,SOAR自动化,"无人入选",持续审核。
17)实施路线图
M0-M1(MVP):网络细分,WAF/DDoS,SSO+MFA,KMS,基本管理策略,标准化逻辑/度量/Trays,SIEM。
M2-M3:映像签名和录取验证,SBOM,IaC,PAM上的Conftest/OPA,轮换计划,定期补丁,首次DR测试。
M4-M6:SOAR花花公子,eBPF/运行时细节,EASM,合规包(PCI/GDPR),一套完整的审核工件,按地区排列DR。
M6+:零信任网络(mTLS无处不在),CIEM,自动审计审查报告,持续的"紫色团队"测试。
简短输出
强质子不是一组"铁"规则,而是系统:细分,严格的身份和秘密,受保护的交付,受控容器,可观察性和自动响应。添加可验证性(审计工件,SBOM/签名,日志),并且程序环境变得可预测,可管理和准备进行外部检查-在发布速度和业务SLO上没有妥协。