scikit-learn 拟合函数立即返回,处理了 0 个训练样本

scikit-learn fit function returns immediately with 0 training samples processed

提问人:vegarab 提问时间:11/15/2023 最后编辑:DataJanitorvegarab 更新时间:11/16/2023 访问量:53

问:

我遇到了版本问题,其中函数几乎立即返回,而无需处理任何训练样本。这一点很明显,因为模型的参数(指示求解器在拟合过程中看到的训练样本数)保持在 。scikit-learn1.3.2fit()MLPClassifiert_0

在尝试拟合包含超过 100,000 个训练样本的数据集时,会出现此问题,其中函数在不到 10 毫秒的时间内返回。以下最小示例复制了该问题:fit()

from sklearn.neural_network import MLPClassifier

X = [[1., 2.], [3., 4.]]
y = [1, 0]

clf = MLPClassifier(solver="lbfgs", alpha=1e-5, hidden_layer_sizes=(5, 2))
clf.fit(X, y)

print(clf.t_)  # Outputs: 0

我已经搜索过,但没有发现报告的类似问题。如果能深入了解为什么会发生这种情况,我们将不胜感激。

编辑:我在多个模型中一致地观察到这种行为。scikit-learn

蟒蛇 scikit-learn

评论

0赞 Marijn 11/15/2023
不过,它确实预测正确,所以它已经“学习”了(例如尝试)。clf.predict([[3,4],[1,2]])
0赞 vegarab 11/15/2023
我的结果是array([1, 1]),它根本没有学习。@Marijn 同样,如果输入数据设置如下: X = np.random.rand(10_000, 10), y = np.random.randint(2, size=10_000) 它仍然会在 <10 毫秒后返回。

答: 暂无答案