PSI 群体稳定性指数计算器:在线计算与可视化
什么是 PSI?
PSI(Population Stability Index,群体稳定性指数) 是衡量两个概率分布之间差异的统计指标,广泛应用于风控模型、推荐系统等机器学习模型的监控环节。PSI 值越大,说明分布偏移越严重,模型稳定性越差。
在线 PSI 计算器
PSI 计算器加载中...
PSI 阈值判断标准
| PSI 值 | 状态 | 含义 | 建议措施 |
|---|---|---|---|
| PSI < 0.1 | 🟢 稳定 | 分布无明显变化 | 模型可继续使用,正常监控 |
| 0.1 ≤ PSI < 0.25 | 🟡 轻微偏移 | 分布发生一定变化 | 关注并排查变化原因(数据源、业务调整等) |
| PSI ≥ 0.25 | 🔴 显著偏移 | 分布发生重大变化 | 需重新评估模型或重新训练 |
使用说明
交互流程
- 调整分箱数:使用顶部分箱控制器设置 2~15 个分箱
- 编辑占比分布:拖拽滑块或直接输入调整各箱的预期分布和实际分布
- 锁定分箱:点击锁定图标固定特定分箱,调整时其他箱自动均摊
- 一键归零:点击"均摊归零"将待分配差额自动分配到未锁定分箱
- 计算 PSI:待分配池归零后,点击"计算 PSI"查看结果
计算结果解读
计算结果展示:
- 总 PSI 值及阈值判断(绿/黄/红指示灯)
- 每箱贡献明细:展示各分箱对总体 PSI 的贡献值和占比
- 可视化图表:直观对比预期分布与实际分布的差异
常见问题
什么是 PSI(群体稳定性指数)?
PSI(Population Stability Index,群体稳定性指数)是衡量两个概率分布之间差异的统计指标。计算公式为:
PSI = Σ (Aᵢ − Eᵢ) × ln(Aᵢ / Eᵢ)
其中 Eᵢ 为历史/预期分布在第 i 个分箱的占比,Aᵢ 为新数据/实际分布在第 i 个分箱的占比。
PSI 和 KS、IV 有什么区别?
| 指标 | 用途 | 关注点 |
|---|---|---|
| PSI | 模型监控 | 数据分布随时间的变化 |
| KS | 模型评估 | 模型区分正负样本的能力 |
| IV | 特征筛选 | 单个特征对目标的预测能力 |
三者用途不同:KS 看效果,IV 选特征,PSI 看稳定性。
如何选择合适的 PSI 分箱数?
分箱数通常选择 10 或 20,也可按业务需求设定:
- 分箱过少 → 丢失分布细节
- 分箱过多 → 每箱样本量不足,统计不稳定
- 一般建议每箱至少包含 5% 的样本量
本工具支持 2~15 个分箱,方便对比不同分箱策略下的 PSI 变化。
💡 更多数据仓库工具请查看 实用工具
📱关注公众号
「数据仓库技术」文章同步更新,不错过每一篇干货

💬加群交流
备注「数据仓库技术」加入社群,每日一道大厂SQL真题
