将mutual_info_classif用于连续要素和离散目标

Using mutual_info_classif for Continuous Features and Discrete Target

提问人:RafiO 提问时间:7/18/2023 最后编辑:RafiO 更新时间:9/4/2023 访问量:140

问:

我在 Google Bard 中遇到了这个声明,但我在 scikit-learn (sklearn) 文档中找不到任何引用。该陈述如下:“连续特征和离散目标变量之间的互信息并不总是有意义的。互信息衡量一个变量可以提供的关于另一个变量的信息量。对于连续特征和离散目标变量,连续特征无法提供有关离散目标变量的任何信息,因为离散目标变量只能采用有限数量的值。

我对将mutual_info_classif评分函数用于连续特征和离散目标感兴趣。它似乎有效,但我收到一条警告,指出:“UserWarning:聚类指标需要离散值,但收到标签的连续值和目标的二进制值”。

机器学习 scikit-学习 选择 特征 -工程 互信息

评论


答:

0赞 RafiO 8/17/2023 #1

我通过离散化数据集解决了警告。但仍然感到困惑mutual_info_classif是否可以将评分方法用于连续特征和离散目标