Redian新闻
>
一步一步理解机器学习的ROC曲线

一步一步理解机器学习的ROC曲线

科技

你好,我是zhenguo

ROC曲线是评估机器学习模型分类能力最常用的一条曲线,那么你知道:

  • ROC曲线x,y轴各代表什么含义?
  • ROC曲线上的一个点代表什么含义?

这两个问题在面试中也常会被问道,不妨抽几分钟时间理解我下面的这篇小总结。

二分类混淆矩阵

下面是二分类的混淆矩阵,这个不难理解,P或N代表结果,T或F代表预测对与否:

基于二分类混淆矩阵,我们再来探讨关于ROC曲线上面提出的两个问题。

ROC曲线x,y轴各代表什么含义?

x轴是FPR,y轴是TPR,如下图所示:

其中:

x轴的FPR,即假阳率:

想象为:在所有的恶性肿瘤中,被预测成良性的比例,显然我们希望这个比例越小越好

y轴的TPR就是Recall值,即真阳率:

想象为:在所有良性肿瘤中,被预测为良性的比例,显然我们希望这个比例越大越好

ROC曲线上的四个特殊点

对于二分类,要么为0,要么为1,那么我们可以无脑的预测所有样本为0. 此时,不管是FP,还是TP都为0,因为我们没有预测哪怕一个样本为P,即为1.

故,我们得到一个特殊点(FPR=0, TPR=0),即(0, 0):

这个点虽特殊,但却是任何一条ROC曲线都会包括的!

同样的,如果我们无脑的预测所有样本为1,此时不管是FN,还是TN都为0,所以我们又得到一个特殊点(FPR=1, TPR=1),即(1,1):

同样,此点虽特殊,但却是任何一条ROC曲线都会包括的!

还有2个特殊点,分别对应全部预测对,或全部预测错!如果运气爆棚,全部猜对,此时就是没有一个预测错的,自然:(FPR=0, TPR=1);如果运气糟糕透顶,全部预测错误,自然:(FPR=1, TPR=0)

此两点虽特殊,但却未必一定包括在ROC曲线中。

ROC曲线上的点到底代表什么含义?

在二分类(0,1)的模型中,一般我们最后的输出是一个概率值,表示结果是1的概率。

那么我们最后怎么决定输入的x是属于0或1呢?

我们需要一个阈值,超过这个阈值则归类为1,低于这个阈值就归类为0。

所以,不同的阈值会导致分类的结果不同,也就是混淆矩阵不一样了,FPR和TPR也就不一样了。

所以当阈值从0开始慢慢移动到1的过程,就会形成很多对(FPR, TPR)的值,将它们画在坐标系上,就是所谓的ROC曲线。

其中阈值为0时,即对应:无脑的预测所有样本为1;当阈值为1时,即对应:无脑的预测所有样本为0。也就是对应的上节提到一定会出现的2个特殊点。

最后如果两种模型得到中间点如下图所示,那么绿色对应模型分类能力好于黄色对应模型:

最后一句话:ROC是用来表征分类器分类能力的曲线!


微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
机器学习的3大“疑难杂症”,因果学习是突破口 | 重庆大学刘礼NeurIPS 2022 | 基于精确差异学习的图自监督学习自然语言处理 · 机器学习 · 深度学习每天喝这2种东西,2岁宝宝乳牙全烂光,娃的牙齿,就是这样一步一步被喂坏的!今日开课|《数据科学·机器学习求职实战营》即将开课,赶快报名!新冠疫情怎样一步一步的改变了纽约的餐馆?终于有人把分布式机器学习讲明白了从机器学习到推荐系统,技术平台全面统一:火山引擎已经发动针对量子多体问题且可证明的高效机器学习,登上Science谁都不是白白热情为人做事我那些信主(信上帝)的朋友们!【Locker Room】橄榄球、女篮、电竞!这次Locker Room运动上新你会选什么?ML如何做科学发现?牛津大学268页博士论文详述科学机器学习内涵远瞩咨询:2022年全球人工智能机器学习细分市场分析详解机票定价规则与延误可能性 让你花更少的钱飞得更顺畅深度解读 | 机器学习和深度学习的区别到底是什么?美国这届高院正走在历史倒退的路上机器学习与资产定价发展空间巨大 | 机器学习工程师求职1V1定制计划随时启动!A股市场机器学习多因子模型实证如何让自己一步一步废掉?10月下预告!机器学习、量化金融背景提升项目实战开课!Robeco:使用机器学习发现被错误定价的股票聊一聊机器学习的MLE和MAP:最大似然估计和最大后验估计我跟着孩子,一步一步长成了“刚刚好”的父母​一文梳理ICML 2022中图机器学习热点和趋势美国新泽西理工 招收2023春季/秋季入学博士生(全奖) 应用机器学习/移动系统安全和隐私ICML 2022 | 关注AI技术的你,快来查收这份机器学习前沿论文精选!南洋理工计算机视觉科研项目招生(仅限机器学习,深度学习,AI,迁移学习方向)龙卷风健康快递 186机器学习分类问题:9个常用的评估指标总结对话 | AI、机器学习在材料科学研究中能发挥哪些作用?香港中文大学(深圳)数据科学学院招聘博士后 - 分布式优化和机器学习方向来!新闻流与股价跳跃、图数据应用综述、机器学习与有效前沿零落成泥
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。