Redian新闻
>
二分类任务评价指标(上)

二分类任务评价指标(上)

公众号新闻

每天给你送来NLP技术干货!



来自:AI算法小喵
点击这里进群—>加入NLP交流群

1. 评价指标

在对比不同模型时,我们需要在测试集上用评价指标去对比模型的泛化能力

当然不同的评价指标会有不同的结果,模型的“好”与“差”是相对的。可能在某个指标下,模型A的效果优于模型B;但在另一个指标下,模型B的效果却优于模型A。

我们需要全面了解一个任务的评价指标体系,然后根据具体的业务目标/任务需求去选择相应的评价指标,继而选出符合业务目标/任务需求的好模型。

2. 二分类任务评价指标之精度、错误率

2.1 精度、错误率

在分类任务中,acc(精度、准确率)、error_rate(错误率)是最常用的性能评价指标。

2.1.1 acc

具体地,acc 的定义如下:

其中分别为样本的真实类别与模型对其的预测类别,为总样本量。即acc是分类正确的样本数占总样本数的比例

2.2.2 error_rate

error_rate(错误率)显然和精度是一对互补量,即有:

具体地,error_rate 的定义如下:

分类错误的样本数占总样本数的比例

2.2 二分类任务

将样本归类为两个互斥类别的其中一个的分类任务即为二分类任务。二分类任务非常常见,比如工业生产中机器是否发生故障、信息检索/web搜索中信息是否是用户感兴趣的、接到的电话是否为诈骗电话、接收的邮件是否为垃圾邮件、用户对于商品/新闻的评论所体现出的情感是正面的还是负面的、图像分类中猫狗二分类、核酸检测中样本是阳还是阴...

2.3 混淆矩阵

在二分类任务中南,我们可以根据样本的真实类别和分类模型预测的类别组合将本划分为以下四类:

  • TP(True Positive,真正例):即样本真实类别为正例,预测类别为正例。

  • FP(False Positive,假正例):即样本真实类别为负例,预测类别为正例。

  • TN(True Negative,真负例):即样本真实类别为负例,预测类别为负例。

  • FN(False Negative,假负例):即样本真实类别为正例,预测类别为负例。

结合这四类样本我们可以构建如下混淆矩阵(Confusion Matrix):

真实类别预测类别
正例负例
正例TP(真正例)FN(假负例)
负例FP(假正例)TN(真负例)

2.4 二分类任务中的精度、错误率

在二分类任务中,有了如上混淆矩阵,那么第2.1节中的accerror_rate就可以如下方式计算:

其中

📝论文解读投稿,让你的文章被更多不同背景、不同方向的人看到,不被石沉大海,或许还能增加不少引用的呦~ 投稿加下面微信备注“投稿”即可。

最近文章

深入理解Pytorch中的分布式训练




点击这里进群—>加入NLP交流群

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
神鹰球,信天翁,凤凰球,可遇不可求!【宏观经济】宏观一周:出口集装箱运价指数继续下行提升律所盈利能力,需要做好哪些方面?(上)以科学碳目标(SBTi)为标准,推进企业全价值链碳中和八分甜二分酸的小金黄,一定要尝的金钻凤梨这几天看到好几个网友问到站姿腹肌轮的做法情况,我发一个视频吧。张同道创作课(上)丨找到纪录片创作背后的学术方法论连载(上)丨为了23年的CFA考试,拼了!钓鱼邮件(上)2023爱丁堡大学学生公寓汇总(上) | 英国租房君诗和远方(上) – 巴塔哥尼亚阿根廷段游记漫画类作文怎么写?(上)讲历史,感恩节快乐(上)感恩节的由来,感恩彼此的互助,感恩自治社会独家专访(上):下届唐人街区长候选人安布里亚:华人为什么要投票“七山一水二分田”,这个缺地的省份,是怎么富起来的?「2022 年度极客最爱好物」评选出炉:它们将点亮你的生活(上)“进展超预期”!雷军:二分之一的时间都花在小米汽车上,预计明年上半年量产细细密密的光丨第十八章 平安大道(上)《易经》和乾卦【彭博商业周刊】2022加密行业故事(二):中本聪到底有多牛?(上)美西方抹黑中国的N种伎俩(上)|视觉天下战火重燃!芝加哥市长候选人群雄逐鹿 (上)空间科学在载人航天、深空探测和科学卫星这三类任务中如何发挥作用最航运 | 宁波出口集装箱运价指数周评团队利润分配,一分身份,二分创收,三分管理细细密密的光丨第十七章 月亮代表我的心(上)法律翻译 | 《哥大商法评论》2021年第2期(上)目录+摘要劳荣枝案二审刑事裁定书(上)证监会《关于修改<科创属性评价指引(试行)>的决定》融入爱尔兰新生活七步走(上)浅谈扩散模型的有分类器引导和无分类器引导毛泽东一生大公无私验证的真理好文分享 | 靶向蛋白降解药物(TPD),一个全新的小分子药物时代即将来临!(上)Prompt总结 | 从MLM预训任务到Prompt Learning原理解析与Zero-shot分类、NER简单实践小日子这样过,也挺好
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。