跳到主要内容

PSI 群体稳定性指数计算器:在线计算与可视化

什么是 PSI?

PSI(Population Stability Index,群体稳定性指数) 是衡量两个概率分布之间差异的统计指标,广泛应用于风控模型、推荐系统等机器学习模型的监控环节。PSI 值越大,说明分布偏移越严重,模型稳定性越差。


在线 PSI 计算器

PSI 计算器加载中...

PSI 阈值判断标准

PSI 值状态含义建议措施
PSI < 0.1🟢 稳定分布无明显变化模型可继续使用,正常监控
0.1 ≤ PSI < 0.25🟡 轻微偏移分布发生一定变化关注并排查变化原因(数据源、业务调整等)
PSI ≥ 0.25🔴 显著偏移分布发生重大变化需重新评估模型或重新训练

使用说明

交互流程

  1. 调整分箱数:使用顶部分箱控制器设置 2~15 个分箱
  2. 编辑占比分布:拖拽滑块或直接输入调整各箱的预期分布和实际分布
  3. 锁定分箱:点击锁定图标固定特定分箱,调整时其他箱自动均摊
  4. 一键归零:点击"均摊归零"将待分配差额自动分配到未锁定分箱
  5. 计算 PSI:待分配池归零后,点击"计算 PSI"查看结果

计算结果解读

计算结果展示:

  • 总 PSI 值及阈值判断(绿/黄/红指示灯)
  • 每箱贡献明细:展示各分箱对总体 PSI 的贡献值和占比
  • 可视化图表:直观对比预期分布与实际分布的差异

常见问题

什么是 PSI(群体稳定性指数)?

PSI(Population Stability Index,群体稳定性指数)是衡量两个概率分布之间差异的统计指标。计算公式为:

PSI = Σ (Aᵢ − Eᵢ) × ln(Aᵢ / Eᵢ)

其中 Eᵢ 为历史/预期分布在第 i 个分箱的占比,Aᵢ 为新数据/实际分布在第 i 个分箱的占比。

PSI 和 KS、IV 有什么区别?

指标用途关注点
PSI模型监控数据分布随时间的变化
KS模型评估模型区分正负样本的能力
IV特征筛选单个特征对目标的预测能力

三者用途不同:KS 看效果,IV 选特征,PSI 看稳定性

如何选择合适的 PSI 分箱数?

分箱数通常选择 10 或 20,也可按业务需求设定:

  • 分箱过少 → 丢失分布细节
  • 分箱过多 → 每箱样本量不足,统计不稳定
  • 一般建议每箱至少包含 5% 的样本量

本工具支持 2~15 个分箱,方便对比不同分箱策略下的 PSI 变化。


💡 更多数据仓库工具请查看 实用工具

📱关注公众号

「数据仓库技术」文章同步更新,不错过每一篇干货

微信公众号二维码
💬加群交流

备注「数据仓库技术」加入社群,每日一道大厂SQL真题

交流微信二维码

你可能还想看