模型评估相关
- 评估指标相关
- AUC的概念,计算过程?除了auc还有什么度量排序结果的指标
- 特异度(Specificity)
- F1 score
- KL散度的概念
评估指标相关
AUC的概念,计算过程?除了auc还有什么度量排序结果的指标
AUC(Area Under the Curve)是衡量二分类模型预测性能的一种常用指标,特别是当我们关注排序能力(即,模型将正类排在负类前面的能力)时。
优势:AUC 不依赖于特定的阈值,适用于不平衡数据和不确定阈值的情况。它衡量的是模型的排序能力,即模型在预测时,正类的概率应该大于负类的概率。
Recall / Sensitivity / TPR(True Positive Rate)
特异度(Specificity)
Specificity / TNR (True Negative Rate): 预测正确的所有负样本占实际所有负样本的比例
用来衡量模型识别负类的能力。特异度的计算公式是:
F1 score
KL散度的概念
基本概念:KL散度(Kullback-Leibler divergence),可以以称作相对熵(relative entropy)或信息散度(information divergence)。KL散度的理论意义在于度量两个概率分布之间的差异程度,当KL散度越大的时候,说明两者的差异程度越大;而当KL散度小的时候,则说明两者的差异程度小。如果两者相同的话,则该KL散度应该为0。数值范围为[0,+∞)