支付路由和故障转移
支付路由和故障转移
1)为什么需要它
转换:BIN/bank/geo/风险下的正确通道/PSP选择将Auth Rate提高5-15个百分点。
成本:动态选择"成功×佣金"将效率率降低10-30 bps。
可持续性:与PSP/3 DS/银行跌落隔离;在部分中断的情况下继续接收和付款。
合规/RG:在路由中灵活实施限制、地理限制、自我约定和制裁规则。
2)目标体系结构(图层)
1.检查层-货币/方法本地化,APM发现,3 DS UX。
2.Payment Orchestrator (Rule Engine)-路由、智能返回、幂等、电路断路器。
3.Risk/KYT引擎-设备/行为器,制裁/RER,velocity,RG限制,3DS策略。
4.Compliance Hub-KYC、制裁提供商、誓章/限额、审计。
5.Wallet&Ledgers是现金和游戏代言人,奖金负债和多货币。
6.Reconciliation&Reporting-T+0/T+1对账,reason codes,税务登记.
7.Observability&Security-度量/logs/traces, Alerts, RBAC, PCI分段。
8.数据/ML-风险评分,按银行/方法预测转换。
3)数据模型和幂等
Payment Intent (PI):一个有字段的存款/付款对象:amount, currency, method, geo, BIN, risk_score, rg_limits, route_history, idempotency_key, status。
相等性:每个流行音乐(PSP-A → PSP-B)都以单个idempotency_key执行;呼叫重播不会改变ledger的状态。
路线期刊:A/B和模型培训所需的路线和响应日志(PSP id,reason code,latency,3 DS-flow,fee)。
4)路由算法(基准)
4.1个招待会(Acquiring)
1.预评分:GEO,BIN/IIN,发行银行,设备,支票,风险评分,RG状态。
2.合并过滤器:制裁/RER,地理块,年龄/自我排斥。
3.成本/成功规则:score=w1· AuthRate+w2·(− Fee)+w3· Health − penalties。
4.3 DS政策:TRA/whitelisting/step-up风险,挑战选择vs frictionless。
5.路线选择:PSP-A →(在故障/错误上)→ PSP-B →替代方法(APM/开放银行)。
6.Smart Retry:更改3 DS模式,MID, mcc/fallback, reason代码超时(05/51/62 ≠ 91/96)。
7.后处理:在Route Journal中记录,权重更新。
4.2付款(Payouts)
1.优先级:速度(instant/near-instant)↔成本↔可用性。
2.KYT/AML/RG: velocity, "nall"模式,限额,资金来源,异常列表。
3.路由:card to card OCT/RTP/Faster Payments/SEPA Instant/Pix/UPI。
4.Failover: 在银行/PSP不可用的情况下,queued payouts(定期排队)。
5.Confirmation:带签名的webhooks在差异时补偿交易。
5)Failover模式
5.1 Circuit-breaker
本地(在PSP上):在error_rate↑,latency↑中,在declines(issuer-specific)中触发。
全球(每种方法):在行业失败的情况下(例如大型银行ACS/3DS)。
状态:Closed → Open →半场开放;超时和阈值由GEO/BIN段指定。
5.2 Active-Active vs Active-Passive
Active-Active:并行PSP/方法;按规则/成本进行平衡;最佳RTO/RPO。
Active-Passive:节省佣金/支持,但RTO时间更长;适合次要GEO/方法。
5.3 Degradation Modes
禁用高风险方法,将部分流量转换为开放银行/APM。
强制3 DS挑战所有"燃烧"BIN/银行。
金额/频率的临时限制(RG+风险)。
6)处理3DS/SCA(动态)
低风险/小支票的默认无裂纹,高风险的挑战.
PSD2例外:LVA,MOTO,MIT-在编排器而不是应用程序中。
Fallback:当ACS降解时-提高挑战率或暂时将流量转移到替代方法(开放银行)。
KPI: challenge rate, frictionless share, post-3DS approvals.
7)与antifrod/KYT/RG整合
路由前-评分(设备、行为、代理/VPN、BIN风险、历史记录)。
在路由中-通过risk_score选择3 DS/通道/PSP。
付款前-KYT/velocity/反竖琴(快速win→withdraw,多张卡,相关设备)。
RG限制和自我排斥是编排器级别的"严格"停止规则。
8)可观察性和数据
实时度量标准:auth_rate, decline_reason mix, p95 latency, PSP health, 3 DS success, payout time, queue depth。
Alerts:按银行/方法划分的阈值,带有外部状态页面的滑动。
A/B&Lerning:根据转换/成本更新路由权重;校准无后退控制组。
9) KPI和目标目标
Auth Rate(地图):EU 85-92%,US 80-88%,LATAM 70-85%(无编排-下边缘)。
p95 latency auth API: < 3 c;webhooks: < 60 c.
即时付款分享:≥ 70%的"轻度"支票。
路由效率(转换÷成本):调整后季度对基线的+5-10%。
电路断裂RTO:<2分钟;RPO:0(幂等)。
Chargeback rate: < 0.按计数5%(取决于产品/GEO)。
10)事件花花公子(spargalka)
10.1按发行银行划分的质量决定
1.确认BIN/issuer的尖峰。
2.打开本地电路断路器→重新分配到alt-PSP/方法。
3.增加受影响BIN的挑战率,包括智能复古。
4.通信到状态渠道;带有reason代码数据的RCA。
10.2下降3DS/ACS
1.Timeouts/"soft decline"生长细节。
2.将部分流量转换为开放银行/APM;在ACS活着的地方启用"挑战全部"。
3.降低风险支票(金额/速度限制),加强监控。
10.3 PSP不稳定性
1.健康警报→开放式决胜局奏效。
2.转移到备用PSP/MID;禁止高潜伏的"重"方法。
3.通过使用金丝雀(1-5%的流量)进行半开式恢复,然后进行分级。
10.4付款延误
1.转换为优先级为queued payouts(VIP,金额限制)。
2.将零件移至备用导轨(RTP/FPS/SEPA Instant/Pix)。
3.向玩家发出透明通知;手动升级>X小时。
11)SLA和合同锚点(PSP要求)
可用性: ≥ 99。95%的录取;p95 latency < 3 c;webhooks < 60 c.
事件:TTA ≤ 15分钟,解决方法(fallback MID/APM),RCA ≤ 5天。
数据:原始理性代码,银行详细信息,退货≤ 10天。
财务:储备金上限/后盾,透明功能(包括3DS/network tokens),外汇附加费。
安全性:PCI-AOC、webhooks签名、密钥旋转、SOC 2/ISO 27001(最好)。
12)区域模式
EC/UK:PSD2/SCA;卡+开放银行(SEPA Instant/FPS)。强大的3 DS编排,TRA和whitelisting。
美国:地图+ACH;即时付款优先级(推到卡,RTP)。冲锋队轮廓是强制性的。
LATAM:Pix(BR),SPEI(MX),PSE(CO);APM-heavy;专注于Devyce风险和KYC文档。
土耳其/CA:本地转移/钱包;加强制裁/AML路径,限制金额/速度。
亚洲/印度:UPI/电子钱包;严格的velocity规则;按发行银行路由。
13)实施支票
体系结构/数据
- Payment Intent+所有房屋的幂等。
- Route Journal,原始的理性代码,带有签名的webhooks。
- 现金/游戏代理人的分离;补偿交易。
路由/规则
- GEO/BIN/issuer/风险/成本规则引擎。
- 带有超时后卫和换3DS/MID功能的Smart retry。
- 电路断路器本地和全球;金丝雀回报。
风险/合规性
- 路由前后风险集成/KYT/RG。
- 制裁/RER,年龄/自我隔离-作为"硬"过滤器。
- 权重/金额限制;决策日志。
可观察性/SLA
- Dashbords by Auth Rate, latency, decline mix, payout time.
- Alerta在急流中;runbooks事件。
- 合同中的SLA,QBR和违规罚款。
14)策略伪代码(针对团队)
on PaymentRequest(PI):
ensureIdempotency(PI.key)
risk = RiskEngine.score(PI)
if not ComplianceHub.pass(PI, risk): reject()
candidates = RouteCatalog.filter(PI.geo, PI.method, PI.bin, risk)
for route in rankBy(Score(AuthRate, Fee, Health, Risk), candidates):
res = PSP.call(route, PI, policy=ThreeDS.select(risk))
log(RouteJournal, route, res)
if res.approved: return approve(PI)
if isRetryable(res.reason): continue with SmartRetryAdjustments()
return decline(PI)
15)经济学和A/B优化
Считайте effective rate = (Fees + 3DS + FX + chargeback cost − interchange rebates) / Approved Volume.
A/B:至少10k交易/分支,2-4周;记录银行/方法。
通过GEO/季节性优化 AuthRate vs Fee权重;控制"倾斜"到昂贵但转换的导轨。
16)记住什么很重要
编曲+规则+数据是支付可持续性和转换的核心。
相等性/支付Intent消除了双重注销并简化了失败。
电路断路器和金丝雀回程可实现快速稳定,没有"摆动"。
PSP的合同SLA和透明数据不是选项,而是要求。
区域轨道(开放银行,RTP,Pix/UPI)通常在速度/成本上优于地图-在路由中考虑。