scikit-learn 问答列表

是否可以使用 scikit-learn K-Means 聚类指定自己的距离函数?

作者:bmasc 提问时间:4/3/2011

是否可以使用 scikit-learn K-Means 聚类指定自己的距离函数?...

AttributeError:“numpy.ndarray”对象没有属性“columns”->,当我甚至没有将 dataframe 更改为 np.ndarry 时

作者:PRADDYUMN YADAV 提问时间:11/11/2023

目前,我正在尝试破解 Kaggle 的宇宙飞船泰坦尼克号数据集,当我这样做时,我遇到了一个错误(如下)。在下面的代码中,是从中移除转换要素后的相同数据集。X from sklearn.base im...

StandardScaler 与 Min-Max Scaler 的线性回归模型性能差异

作者:Mohan Pashte 提问时间:10/4/2023

我正在研究一个线性回归问题,我注意到在使用不同的缩放技术时模型性能存在显着差异:StandardScaler 和 Min-Max Scaler。我希望社区对此事有深刻的见解和意见。 import p...

XGBoost 警告:当输入数据在 cpu 上时,在 cuda 上运行

作者:user7431005 提问时间:11/10/2023

我尝试使用 GPU 加速训练 XGBoost 模型。 使用 gridsearch 训练模型时,我收到以下警告: 用户警告: [17:29:04] 警告: /workspace/src/common/...

scikit-learn 随机森林中单个树的节点值差异

作者:Tongwen Li 提问时间:10/31/2023

我使用该包构建了一个随机森林模型,并可视化了第一棵树。我不明白为什么有些节点的“价值”不等于平均值。scikit-learn import numpy as np from sklearn impo...

多维轨迹聚类

作者:Castell089 提问时间:11/6/2023

我有一个包含多个飞行轨迹的大数据集。这些轨迹都有一个唯一的 ID 来识别它们。它们位于经典的 pandas Dataframe 中。轨迹的每个样本都有多个特征,如经度、纬度、高度、速度等等,如 15 ...

在大型数据集上使用提取的特征向量进行图像聚类

作者:vmchance 提问时间:11/3/2023

我一直在尝试在一个非常大的图像数据集(大约 100 万张图像)上使用多种聚类技术。该过程非常标准 - 例如,使用预训练的 CNN(在本例中为 VGG19)来提取特征并测试许多聚类方法(目前是分层和 k...

获取分层聚类之间的距离 usin scikit

作者:slow_learner 提问时间:11/7/2023

我目前正在使用 Python 使用 SciKit 模块将一系列聚类计算为 Clustering_Jerarquico=linkage(data_state_normalized, 'average'...

如何使用直方图或表DataFrame作为线性回归中的预测因子?

作者:Raeed Mundow 提问时间:11/11/2023

我正在尝试构建一个模型,可以计算光晕中暗物质粒子的浓度,已经有软件包和方法可以根据称为 NFW 曲线的特定密度分布在径向网格中生成粒子。我把粒子的每个实现都变成一个直方图,我想用这个直方图作为我的预测...

无法从“sklearn.exceptions”导入名称“InconsistentVersionWarning”

作者:Matheus Brandão 提问时间:11/13/2023

我正在尝试导入sklearn,但我不断收到此错误 --------------------------------------------------------------------------...


共87条 当前第1页