微前端架构如何改变企业的开发模式与效率提升
1145
2022-10-30
AUC / uAUC
AUC,具体计算方法这里不列了,这里主要说一下对AUC的一些理解,公式参见机器学习常见面试题目。
为什么AUC这么受欢迎呢?
首先是它反应的是模型的排序能力,它不关心具体的打分Score的绝对值,只关心排序的相对顺序,比如AUC是0.75,我们说随机的选一个正样本和一个负样本,模型打分正样本高于负样本的概率是0.75。
另外,他对采样不敏感,在样本分布不变的情况下,正样本占比10%和占比50%计算的AUC结果差异不大,怎么解释呢?还是前面的例子,随机拿一个正样本,模型预估为score1,因为是随机采样,小于score1的负样本和大于score1的负样本比例不会变化,反之也是。
所以AUC反应的是模型预估样本的排序关系,正负样本的gap越大,AUC越大,如果正负样本完全分开,且特征充分,那么理论上AUC能达到1.0,但是这也仅仅是理想情况,那么我们为什正常线上AUC只有0.7呢?是因为在线上特征集合完全一致,但label不同的数据,学术上称作Bayes Error Rate。为什么要做很多特征工程的事情,就是因为我们想通过在这些数据集合中找到一些特征能够区分开这些样本。
参考:
机器学习中的评估指标
版权声明:本文内容由网络用户投稿,版权归原作者所有,本站不拥有其著作权,亦不承担相应法律责任。如果您发现本站中有涉嫌抄袭或描述失实的内容,请联系我们jiasou666@gmail.com 处理,核实后本网站将在24小时内删除侵权内容。
发表评论
暂时没有评论,来抢沙发吧~