了解 BinningProcess 输出

Understanding BinningProcess output

提问人:hexolitemax 提问时间:9/23/2023 最后编辑:Henry Eckerhexolitemax 更新时间:9/25/2023 访问量:39

问:

我想集成到我的管道中,但在此之前,我需要了解输出。我期待fit_transform后出现垃圾桶,但我获得了接近目标变量的值。optbinning.BinningProcess

有人可以向我解释输出吗?或者向我指出我是否做错了什么。

下面是一个可重现的示例:

import pandas as pd
from random import choices
from random import uniform
from optbinning import BinningProcess

df = pd.DataFrame({'continuous_feature': choices(range(0,30), k=100),
                    'cat_feature': choices(['A', 'B', 'C'], k = 100),
                     'target' : [uniform(15,16) for x in range(0,100)]})
all_features = ["continuous_feature", "cat_feature"]

X = df.loc[:, all_features]
y = df.loc[:, 'target']

BinningProcess(all_features, categorical_variables= ['cat_feature']).fit_transform(X, y)
python scikit-learn 预处理器 optbinning

评论

0赞 Nick ODell 9/23/2023
不确定,因为我以前没有使用过它,但我认为它旨在分别对每个输入变量进行装箱,然后将每个装箱替换为该装箱的目标变量的平均值。如果输入变量和输出之间没有相关性,则此转换的输出将是接近目标变量平均值的值。
0赞 hexolitemax 9/24/2023
谢谢。我没有得到那部分:“将每个箱替换为该箱的目标变量的平均值”。我希望我能有垃圾箱:/

答:

0赞 hexolitemax 9/25/2023 #1

正如 Nick ODell 所提到的,对于每个 bin,binning 算法返回的值是“该 bin 的目标变量的平均值”。如果您愿意获取 bin,请使用 中的选项。metric = "bins"fit.transform(X,y)