二元分类模型中相同概率的不一致预测类分配

Inconsistent Predicted Class Assignments for Same Probability in Binary Classification Model

提问人:Nanov 提问时间:11/6/2023 最后编辑:Konrad RudolphNanov 更新时间:11/6/2023 访问量:55

问:

我正在研究一个二元分类问题,我遇到了这样一种情况,即对于具有相同预测概率为 0.5 的观测值,预测的类分配似乎不一致。该模型为这些情况提供了不同的.pred_class值(0 或 1)。我试图理解为什么会发生这种情况以及如何解释它。下面是我的数据示例:

编号 .pred_class 。排 邻居 weight_func .pred_0 .pred_1 目标 .config
切片1 0 263 12 矩形的 0.5 0.5 0 预处理...
切片3 0 413 12 矩形的 0.5 0.5 0 预处理...
切片3 0 415 12 矩形的 0.5 0.5 0 预处理...
切片3 0 416 12 矩形的 0.5 0.5 1 预处理...
切片3 1 417 12 矩形的 0.5 0.5 1 预处理...
切片5 1 480 12 矩形的 0.5 0.5 1 预处理...

有人能帮我理解为什么 0.5 的相同预测概率的 .pred_class 值不同吗?哪些因素会影响这一点,我应该如何解释这些预测?处理此类案件有什么常见的做法吗?

R 二进制 knn tidymodels

评论

0赞 Nir Graham 11/6/2023
看看你的表格,预测是以 1 个小数精度给出的,这不是很多;我会调查它不仅仅是.pred_1为 0.49 的情况;显示为 0.5 并映射到 0,其他时间显示为 0.504,显示为 0.5 并映射到 1
0赞 Nanov 11/7/2023
概率是tune_grid的结果,它们具有完整的位数;在上面的示例中,您看到了 filter(.pred_1 == 0.5) 的结果,因此 0.5 == 0.5
0赞 Nanov 11/7/2023
只有在使用“矩形”权重函数时才会出现此问题。其他可用的超参数选项包括:'triangular'、'epanechnikov'、'biweight'、'triweight'、'cosine'、'inv'、'gaussian'。

答: 暂无答案