ROC曲线和PR曲线,AP,mAP-FreeNAS中文网

admin 管理员组

文章数量: 887021

ROC曲线和PR曲线,AP,mAP

ROC曲线

对于两类分类任务，y的值可以为1或0，为1时称为正样本（positive），在医学上称为阳，为0时称为负样本（False），在医学上称为阴。

TP：y的值为1，y^为1，预测值和真值都为1，称为true positive
TN：y的值为0，y^为0，预测值和真值都为0，称为true negtive
FP：y的值为0，y^为1，预测值为1，,真值为0，称为false positive
FN：y的值为1，y^为0，预测值为0，真值都为1，称为false negtive
N+：总样本中正样本的数目
N-：总样本中负样本的数目
N+^：预测结果中有多少预测为正样本的数目
N-^：预测结果中有多少预测为负样本的数目

Precison=TP/N+^, 精度、准确率：预测结果为真的样本中真正为真的比例
TPR/Recall=TP/N+ 召回率：预测结果召回了多少真正的真样本
真阳率：有多少真正的正样本被预测为真。
FPR=FP/N_ 假阳率：预测结果中将多少假的样本预测成了真的
F1分数：Precision和Recall调和平均值
F1=2（Prescision*Recall）/(Precison+Recall)

Matthews相关系数用一个值综合混淆矩阵，度量真是值与预测值之间的相关性，定位为：
MCC=(TPTN-FPFN)/sqrt((TP+FP)(TP+FN)(TN+FP)(TN+FN))
分母中任意一对括号相加之和如果为0，那么整个MCC的值就为0
MCC的值在[-1， 1]之间
1：分类器是完美的
0：分类器是随机分类器
-1：分类器是最差的，所有预测结果和实际相反

上面我们讨论给定阈值τ的TPR（真阳率）和FPR（假阳率）

如果不是只考虑一个阈值t，而是在一些列阈值上运行检测器，并画出TPR和FPR为阈值t的隐式函数，得到ROC曲线。

例：根据文章特征?（文章长度、作者的数目、作者之前投递给该杂志的文章数据、…），判断该文章是否会杂志被接收。

测试样本数目：500，其中250篇被接收（红色），250被拒绝（蓝色）。
现有一个分类器1，给定文章特征，输出该文章被接收的概率。下图为分类器1输出的被接收概率概率对应的正样本数目和负样本数目。

假设取阈值为概率阈值0.5: 判断140篇文章被拒绝，360篇文章被接收。线右边共有235个红色样本，125个被接受，10个被拒绝， ??? = 235/250 = 0.94，??? =125/250 = 0.5 ，对应ROC曲线上的点?, ? （(0.5，0.94) 。

假设取阈值为概率阈值0.8: 判断50篇文章被接收，450篇被拒绝。线的右边有50个红色样本，线的右边有0个蓝色样本均接收， ??? = mGkmG ，??? = 0，对应ROC曲线上的点?, ? = (0, 0.2)。

现有一个分类器2，给定文章特征，输出该文章被接收的概率。下图为分类器2输出的被接收概率对应的正样本数目和负样本数。

假设取阈值为概率阈值0.6: 线的右边有200个红色样本，线的右边有0个蓝色样本， ??? =200/250 =0.8，??? = 0，对应ROC曲线上的点?, ? =(0, 0.8)。

特征：

ROC曲线越偏左上角表示分类器性能越好。
AUC （Area Under Curve）：ROC曲线下的面积，取值在[0.5,1.0]，0.5表示随机猜测分类器，1表示完美分类器。
ROC曲线有个很好的特性：当测试集中的正负样本的分布变化的时候，ROC曲线能够保持不变。在实际的数据集中经常会出现类不平衡现象，即负样本比正样本多很多（或者相反），而且测试数据中的正负样本的分布也可能随着时间变化。

PR曲线

Precision and Recall (PR曲线)：用于稀有事件检测，如目标检测、信息检索、推荐系统。

负样本非常多（?_很大），因此??? = ??⁄?_很小，比较TPR和FPR没有太大意义（ROC曲线中只有左边很小一部分有意义）

只讨论正样本（N+,N+^）
Precision and Recall (PR曲线)：阈值变化时的P和R。

Precison=TP/N+^, 精度、准确率：预测结果为真的样本中真正为真的比例
TPR/Recall=TP/N+ 召回率：预测结果召回了多少真正的真样本

特征：
PR曲线越往往右上角越好。

AP

Precision只考虑了返回结果中相关文档的数目，没有考虑文档之间的顺序。
对一个搜索引擎或推荐系统而言，返回的结果是有序的，且越相关的文档越靠前越好，于是有了AP（ Average Precision ）的概念。
AP: 对不同召回率点上的精度进行平均：

mAP

平均AP（Mean Average Percision, mAP）：多个AP的平均
• 物体检测中经常用mAP评价模型性能：多个物体类别的AP的平均

本文标签： ROC曲线和PR曲线 AP mAP

版权声明：本文标题：ROC曲线和PR曲线,AP,mAP 内容由网友自发贡献，该文观点仅代表作者本人，转载请联系作者并注明出处：http://www.freenas.com.cn/jishu/1686525519h5916.html，本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容，一经查实，本站将立刻删除。

技术交流 – FreeNAS中文网

ROC曲线和PR曲线,AP,mAP

ROC曲线和PR曲线,AP,mAP

ROC曲线

PR曲线

AP

mAP

更多相关文章

信息检索中 (IR) 的评价指标: P@n, MAP, MRR, DCG, NDCG

信息检索中的度量precison@k,recall@k,f1@k,MRR,ap,map,CG, DCG,NDCG

Map ?

c++:list, vector, map, set 区别与用法比较

list, vector, map, set 区别与用法比较

c++ list, vector, map, set 区别与用法比较

std的list, vector, map,multimap, set 区别与用法比较

路由器当ap用虚拟服务器不能用,解决用TPLINK路由器配置模拟AP时Internet连接共享是空白的问题...

链接无线怎么访问服务器ip,无线ap可以和路由器直接连接吗？

如何用2个无线路由器设置AP

腾达ap设置说明_腾达无线路由器ap模式如何设置

无线路由器怎样改成AP模式

无线AP与无线路由器的区别

利用笔记本热点AP功能实现在没有越狱的iPadiPhone抓包

开启Windows7的隐藏功能：虚拟WiFi和SoftAP（即虚拟无线AP）

自建AP wifi

Windows 7实现WiFi-AP无线网络共享

腾达ap设置说明_腾达路由器怎么设置AP模式？

利用MAP文件精确定位代码中出错的代码行

Ubuntu共享WiFi(AP)给Android方法汇总

发表评论

推荐文章

图解 ARP 协议

油价继续下滑并接近跌破70关口

Redis Windows 版本下载

Windows系统设置共享文件夹及访问共享文件夹

更改电脑默认打开的浏览器

热门文章

openwrt远程控制插件_远程电脑开机的各种方法详细总结（含智能wifi插座+续电器制作）...

如何把 Kitten编程猫上开发出来的项目打包成安卓平台上可以安装的apk文件

虚拟机中安装Ubuntu 20.04，Liunx系统的常用命令以及工具安装

python检测鼠标单击后截图代码

如何利用qemu搭建SOC protoype：80行代码实现一个Cortex M4 模拟器

学历贬值，考研究竟还有什么？

U盘提示格式化的原因，还有解决方法

系统漏洞基础知识

linux &amp; windows C++开发差异

推荐一些中国免费学java的网站

最新文章

Raid技术

LSI_阵列卡操作手册

破解Centos7_root用户密码

Redhat重置Root用户密码方法

远程批量修改linux服务器密码的脚本

Windows7 系统安全设置权限技巧

（Windows系统）详细介绍Windows系统 含有英文版

最新Windows 11教育版下载：专为教育设计的系统！

Win7系统下搭建NFS服务器

零基础使用UltraISO制作并安装纯净Win10系统指南

linux & windows C++开发差异

（Windows系统）详细介绍Windows系统含有英文版