scikit-learn 问答列表

一种缩短具有 612 个以上特征的特征选择时间的方法

作者:Gray 提问时间:10/31/2023

我必须制作一个具有 612 个特征的 svm 模型,所以我想通过特征选择正向方法减少它们,但时间花了很多时间。有没有办法减少计算时间? 这是我的代码: from sklearn.model_sel...

如何使用直方图或表DataFrame作为线性回归中的预测因子?

作者:Raeed Mundow 提问时间:11/11/2023

我正在尝试构建一个模型,可以计算光晕中暗物质粒子的浓度,已经有软件包和方法可以根据称为 NFW 曲线的特定密度分布在径向网格中生成粒子。我把粒子的每个实现都变成一个直方图,我想用这个直方图作为我的预测...

如何限制sklearn GridSearchCV CPU使用率?

作者:Jim Chen 提问时间:10/30/2023

我使用如下:GridSearchCV gsearch_lgb = GridSearchCV( model(**self.model_params), param_grid=self.model_...

scikit-learn 随机森林中单个树的节点值差异

作者:Tongwen Li 提问时间:10/31/2023

我使用该包构建了一个随机森林模型,并可视化了第一棵树。我不明白为什么有些节点的“价值”不等于平均值。scikit-learn import numpy as np from sklearn impo...

多维轨迹聚类

作者:Castell089 提问时间:11/6/2023

我有一个包含多个飞行轨迹的大数据集。这些轨迹都有一个唯一的 ID 来识别它们。它们位于经典的 pandas Dataframe 中。轨迹的每个样本都有多个特征,如经度、纬度、高度、速度等等,如 15 ...

在大型数据集上使用提取的特征向量进行图像聚类

作者:vmchance 提问时间:11/3/2023

我一直在尝试在一个非常大的图像数据集(大约 100 万张图像)上使用多种聚类技术。该过程非常标准 - 例如,使用预训练的 CNN(在本例中为 VGG19)来提取特征并测试许多聚类方法(目前是分层和 k...

获取分层聚类之间的距离 usin scikit

作者:slow_learner 提问时间:11/7/2023

我目前正在使用 Python 使用 SciKit 模块将一系列聚类计算为 Clustering_Jerarquico=linkage(data_state_normalized, 'average'...

XGBoost 警告:当输入数据在 cpu 上时,在 cuda 上运行

作者:user7431005 提问时间:11/10/2023

我尝试使用 GPU 加速训练 XGBoost 模型。 使用 gridsearch 训练模型时,我收到以下警告: 用户警告: [17:29:04] 警告: /workspace/src/common/...

LogisticRegression 代码中的整形问题

作者:Joo 提问时间:11/11/2023

我尝试进行 LogisticRegression。 import pandas import matplotlib.pyplot as plt from sklearn.linear_model i...

无法从“sklearn.exceptions”导入名称“InconsistentVersionWarning”

作者:Matheus Brandão 提问时间:11/13/2023

我正在尝试导入sklearn,但我不断收到此错误 --------------------------------------------------------------------------...


共87条 当前第4页