scikit-learn 问答列表

如何将所有权重和树从 xgboost.spark.SparkXGBClassifier 复制到 xgboost.sklearn.XGBClassifier?

作者:Analysa Marie 提问时间:11/16/2023

长话短说,我使用 xgboost.spark.SparkXGBClassifier 在 Spark 中训练了一个 xgboost 分类器模型: from xgboost.spark import S...

已弃用的 confusion_matrix 方法

作者:Tanner Tolman 提问时间:11/14/2023

我正在学习 Udemy 课程,似乎它的某些方面尚未经过编辑以反映最近的更新。我正在尝试使用朴素贝叶斯为分类问题创建混淆矩阵,但我无法获得使用更新函数所需的材料。 数据集是关于航空公司评论的,我已将其...

将线性 SVC 系数导出到 PMML

作者:Hannah Oosterhuis 提问时间:11/14/2023

我正在尝试将线性 SVC 导出到 PMML。我创建了一个 sklearn 管道 (sklearn.pipeline.Pipeline),其中包含一个 SimpleImputer、一个标准缩放器和一个线...

AgglomerativeClustering 大数据集

作者:Currant24 提问时间:11/13/2023

我有一个大型数据集data_arr - 2600 万行。 我将其聚类为 50 个聚类 对我有用的聚类方法是 WARD。 使用这种方法,我得到了最合适的结果。 使用以下代码进行聚类分析: n_clu...

训练随机森林分类器:对单个测量文件进行大规模排序

作者:Derbengale 提问时间:10/25/2023

我有一个旧的但不能完美工作的随机森林分类器,我想用它来改进,我已经对 3000 个文件进行了预分类,所以我有一个文件夹(包含一个“坏”和“好”文件夹),其中 90% 的测量值被正确分类。 我想改进我...

分类指标无法处理二进制目标和连续目标的混合 [重复]

作者:PhilBot 提问时间:1/31/2019

这个问题在这里已经有答案了: 准确性得分 ValueError:无法处理二进制和连续目标的混合 (8 个答案) 2年前关闭。 我尝试训练和测试几个 scikit-learn 模型,并尝试打印出准确性...

sklearn 感知器无法对 NAND 函数进行分类

作者:deepLDoc 提问时间:8/18/2023

我是机器学习的新手。我正在实现一个感知器,以查看哪些逻辑门功能是线性可分离的。对于NAND门,我得到了意想不到的结果。对于输入 X 和输出 y,模型给出的分数为 0.5,y 预测为 [1,0,0,0]...

如何检测参数网格中允许的值?

作者:Magnus 提问时间:6/30/2017

我已经开始从事一个项目,在该项目中,我需要检测给定 scikit-learn 估计器的可训练参数,如果可能的话,找到分类变量的允许值(以及连续变量的合理间隔)。 我可以获取带有参数的字典 using...

版本 0.22.2 和 1.2.2 之间具有相同random_state的不同集群结果

作者:Okorimi Manoury 提问时间:7/31/2023

我正在处理一个聚类问题。为了确保结果的可重复性,我们最初将参数设置为 0。但是,将scikit-learn从版本0.22.2更新到版本1.2.2后,我遇到了一个意外的问题。当我使用相同的数据集运行相同...

GridSearchCV 机器学习

作者:Pieter Jansen 提问时间:7/29/2023

我使用 GridSearch 来查找此决策树的相对最佳超参数(并使用 K-Fold CV 来评估模型的性能)。请查看代码和输出结果中的“最佳结果”行。 为什么它没有给我任何关于标准的信息(例如,是使...


共87条 当前第5页