随机森林模型中的类权重 - TFDF 库

Class weights in Random Forest model - TFDF library

提问人:Marta Buetas 提问时间:10/30/2023 最后编辑:rstzMarta Buetas 更新时间:11/14/2023 访问量:35

问:

我想从随机森林决策树库向随机森林模型添加类权重,以考虑少数类。

我没有在文档中找到如何做到这一点或如何在损失函数中修改它。我知道在 sklearn 库中可以轻松完成,但我对使用 TensorFlow 库感兴趣。非常感谢您的所有建议。

TensorFlow 随机森林 tensorflow-decision-forests

评论


答:

1赞 rstz 10/30/2023 #1

Tensorflow Decision Forests 允许用户在训练数据集中指定权重列。此列的条目将用作示例权重。这是添加类权重的唯一方法。

当输入 转换后的 Pandas DataFrame 时,可以直接使用参数指定权重列,例如,tfdf.keras.pd_dataframe_to_tf_dataset()weights=

ds = tfdf.keras.pd_dataframe_to_tf_dataset(train_ds_pd, label="my_label", weights="my_weights")

直接馈送 Tensorflow 数据集时,将权重列作为 tf 中的第三个通道分开。数据集(正如 Keras 所预期的那样)。tf 的第二个通道。数据集必须始终是标签列。

完全披露:我是 Tensorflow Decision Forests 的作者之一。