如何将所有权重和树从 xgboost.spark.SparkXGBClassifier 复制到 xgboost.sklearn.XGBClassifier?
作者:Analysa Marie 提问时间:11/16/2023
长话短说,我使用 xgboost.spark.SparkXGBClassifier 在 Spark 中训练了一个 xgboost 分类器模型: from xgboost.spark import S...
scikit-learn 问答列表
作者:Analysa Marie 提问时间:11/16/2023
长话短说,我使用 xgboost.spark.SparkXGBClassifier 在 Spark 中训练了一个 xgboost 分类器模型: from xgboost.spark import S...
作者:Tanner Tolman 提问时间:11/14/2023
我正在学习 Udemy 课程,似乎它的某些方面尚未经过编辑以反映最近的更新。我正在尝试使用朴素贝叶斯为分类问题创建混淆矩阵,但我无法获得使用更新函数所需的材料。 数据集是关于航空公司评论的,我已将其...
作者:Hannah Oosterhuis 提问时间:11/14/2023
我正在尝试将线性 SVC 导出到 PMML。我创建了一个 sklearn 管道 (sklearn.pipeline.Pipeline),其中包含一个 SimpleImputer、一个标准缩放器和一个线...
作者:Currant24 提问时间:11/13/2023
我有一个大型数据集data_arr - 2600 万行。 我将其聚类为 50 个聚类 对我有用的聚类方法是 WARD。 使用这种方法,我得到了最合适的结果。 使用以下代码进行聚类分析: n_clu...
作者:Derbengale 提问时间:10/25/2023
我有一个旧的但不能完美工作的随机森林分类器,我想用它来改进,我已经对 3000 个文件进行了预分类,所以我有一个文件夹(包含一个“坏”和“好”文件夹),其中 90% 的测量值被正确分类。 我想改进我...
作者:PhilBot 提问时间:1/31/2019
这个问题在这里已经有答案了: 准确性得分 ValueError:无法处理二进制和连续目标的混合 (8 个答案) 2年前关闭。 我尝试训练和测试几个 scikit-learn 模型,并尝试打印出准确性...
作者:deepLDoc 提问时间:8/18/2023
我是机器学习的新手。我正在实现一个感知器,以查看哪些逻辑门功能是线性可分离的。对于NAND门,我得到了意想不到的结果。对于输入 X 和输出 y,模型给出的分数为 0.5,y 预测为 [1,0,0,0]...
作者:Magnus 提问时间:6/30/2017
我已经开始从事一个项目,在该项目中,我需要检测给定 scikit-learn 估计器的可训练参数,如果可能的话,找到分类变量的允许值(以及连续变量的合理间隔)。 我可以获取带有参数的字典 using...
作者:Okorimi Manoury 提问时间:7/31/2023
我正在处理一个聚类问题。为了确保结果的可重复性,我们最初将参数设置为 0。但是,将scikit-learn从版本0.22.2更新到版本1.2.2后,我遇到了一个意外的问题。当我使用相同的数据集运行相同...
作者:Pieter Jansen 提问时间:7/29/2023
我使用 GridSearch 来查找此决策树的相对最佳超参数(并使用 K-Fold CV 来评估模型的性能)。请查看代码和输出结果中的“最佳结果”行。 为什么它没有给我任何关于标准的信息(例如,是使...