lgb.cv 和 cross_val_score 之间的差异导致使用 LightGBM 进行多类分类-解网

问：

我希望在使用和时获得类似的交叉验证结果，但它们差异很大：lgb.cvcross_val_score

import lightgbm as lgb
import pandas as pd
from sklearn import datasets
from sklearn.metrics import log_loss
from sklearn.model_selection import cross_val_score

from typing import Any, Dict, List


def log_loss_scorer(clf, X, y):
    y_pred = clf.predict_proba(X)
    return log_loss(y, y_pred)


iris = datasets.load_iris()
features = pd.DataFrame(columns=["f1", "f2", "f3", "f4"], data=iris.data)
target = pd.Series(iris.target, name="target")
# 1) Native API
dataset = lgb.Dataset(features, target, feature_name=list(features.columns), free_raw_data=False)

native_params: Dict[str, Any] = {
    "objective": "multiclass", "boosting_type": "gbdt", "learning_rate": 0.05, "num_class": 3, "seed": 41
}
cv_logloss_native: float = lgb.cv(
    native_params, dataset, num_boost_round=1000, nfold=5, metrics="multi_logloss", seed=41, stratified=False,
    shuffle=False
)['valid multi_logloss-mean'][-1]

# 2) ScikitLearn API
model_scikit = lgb.LGBMClassifier(
    objective="multiclass", boosting_type="gbdt", learning_rate=0.05, n_estimators=1000, random_state=41
)
cv_logloss_scikit_list: List[float] = cross_val_score(
    model_scikit, features, target, scoring=log_loss_scorer
)
cv_logloss_scikit: float = sum(cv_logloss_scikit_list) / len(cv_logloss_scikit_list)
print(f"Native logloss CV {cv_logloss_native}; Scikit logloss CV train {cv_logloss_scikit}")

我使用本机 API 获得分数，使用 API 获得分数。我尝试了不同的指标，但两种方法之间的结果仍然非常不同。这种差异是否有具体原因，我怎样才能使两种方法之间的结果保持一致？0.88038002910636040.37528027519836027scikit-learn

编辑：正如 @DataJanitor 所建议的那样，我从本机 API 中禁用了 multi_logloss 指标，并实现了自己的指标：

def log_loss_custom_metric(y_pred, data: lgb.Dataset):
    y_true = data.get_label()
    loss_value = log_loss(y_true, y_pred)
    return "custom_logloss", loss_value, True

我通过参数将其传递给本机 api：feval

cv_logloss_native: float = lgb.cv(native_params, dataset, num_boost_round=1000, nfold=5, feval=log_loss_custom_metric, shuffle=True)["valid custom_logloss-mean"][-1]

但是，结果仍然相差很大（本机 API 为 0.58，scikit API 为 0.37）。

我报告的代码是 100% 可重现的，因为我使用的是鸢尾花数据集。如果有人能设法匹配分数并实际告诉我哪个是差异的根源，那就太好了。

python scikit-learn 交叉验证多类分类 lightgbm

感谢您对此进行调查。分层和洗牌不是差异的根源，因为我尝试了所有可能的组合，但结果总是不同。我尝试禁用本机 API 的默认指标并实现我自己的日志丢失（我刚刚编辑了帖子，以便您可以看到如何），但是本机 API 的得分为 0.58，scikit API 的得分为 0.37。此外，我尝试了不同的指标（其中一些我 100% 确定具有相同的实现），但我一直得到差异。

0赞 DataJanitor 10/23/2023

@riccio777好吧，太糟糕了，对不起，我想不出任何其他原因导致差异

上一个：LGBMRegressor python 中 tweedie/Regression_l1 目标的自定义损失函数

下一个：预测始终多数类的 Lightgbm 模型

lgb.cv 和 cross_val_score 之间的差异导致使用 LightGBM 进行多类分类

Discrepancy between lgb.cv and cross_val_score results in multiclass classification with LightGBM

评论

评论