使用Excel建立机器学习评分模型
准备写一份材料关于《使用Excel建立机器学习评分模型》,成型的Excel模板已经有了(笔者自己开发的),具体的一些效果截屏见文末。就是不知道有多少人愿意了解?
以下是材料大纲:
为什么使用Excel
Excel的普遍性
微软:2016年3月Office用户量超12亿
根据微软官方公布的数字显示,Office的全球用户量达到了12亿,而Excel是Office中常用的套件工具。
计算性能
Office Excel 2016 中包含 100 万行和 16,000 列的“大网格”,加上多项其他上限被调高,与 Excel 先前版本相比极大地增加了你可创建的工作表的大小。 Excel 中单个工作表可包含的单元格数现达到先前版本的 1,000 倍以上。
本案例需要 Office 2007 或以上版本。
其他优点
不用写代码
没有代码编程要求,只需要理解公式
更直观
Excel自带的表格以及图表能更清晰展示数据和模型
解释性强
案例采用Logistic Regression算法,并结合评分模型方法论。该方法论完整贯穿并展示模型的有效性、区分度、稳定性。数据变量对模型的贡献,以及能结合实际商业业务的理解。
文章范围
使用一个数据案例
拟采用GermanCredit数据集(文末截屏是另外一个数据集)
全部使用Excel实现模型建立过程
不需要额外的软件辅助,建模全流程都在Excel内完成
关于Logistic Regression
- 线性模型
- Logistic Regression
Excel 步骤实现
- 模型方法论
- Binning
- WOE
- IV
- Odds
- KS
- 理解数据
- 观察数据
- 建模步骤
模型监控
- PSI
- 排序性
无图无真相:
可以交互看到Binning表现
可以看到评分结果评价
按照标准评分卡参数设置,得到的变量每个属性的分
还有别的一些特点没有放出来,看大家有没有兴趣了。