scikit-learn 问答列表

多变量时间序列,选择最具表现力的序列,并消除递归特征

作者:Pitone 提问时间:10/22/2023

我正在模拟一个包含 32 个样本、3 个特征、100 个时间步长和 5 个类的数据集。我想在 3 个功能中选择最好的,我正在尝试使用 sklearn 的递归功能消除。 我使用的代码如下 import...

特征工程:如何在 Jupyter Notebook 中创建功能

作者:Peter 提问时间:10/21/2023

我有出租车数据集如下: Vendor_id int64 1 tpep_pickup_datetime datetime64[ns] 2 tpep_dropoff_datetime datetime64...

比较 scikit-learn 版本 1.2.2 和 1.3.1 之间的 k 均值聚类结果

作者:Yin 提问时间:10/18/2023

我在 Python 中使用 scikit-learn 进行 k-means 聚类时遇到了一个问题,其中 1.2.2 和 1.3.1 版本之间的聚类结果似乎不一致。 当我将聚类数 (k) 设置为 3 ...

定义自定义准确率分数:预测中包含的实际更改。Numpy 实现?

作者:Dudelstein 提问时间:10/16/2023

我正在运行一个多标签预测模型。作为性能衡量标准,我正在检查模型中排名靠前的预测是否包含实际情况,其中 .Ny=1 例如,如果我的模型对某个数据点的顶级预测是黄色 (90%)、绿色 (80%)、红色 ...

我正在尝试使用 ColumnTrandformer 填充数值和分类值并使用 OneHotEncoder 转换分类值,但它不起作用

作者:Bhumit 提问时间:10/16/2023

我尝试用 imputer 填充 DataFrame,然后对分类值执行 OneHoTNCODING 但是当我将任何 Alogos 应用于转换后的值时,它会抛出错误,在下面代码中提到,如果我在不使用 co...

错误说我的行不一致,但检查它显示其他情况

作者:Anon_name 提问时间:10/14/2023

我正在尝试训练一个 SVM,我的数据由 3 列组成(str 类型的文本、int 的文本长度以及分别由 1(表示文本是幽默的)和 0 表示的“幽默”标签)。错误返回,我将其理解为我的X_train和y_...

预期的 2D 阵列,得到 1D 阵列,而不是使用 SciKit 进行图像分类

作者:Ginger 提问时间:10/2/2023

我正在尝试使用 .我的数据库包含 656 张图像以及来自 csv 文件的标签。下面是我用来导入图像 + 标签以及调用/创建模型的代码。scikit-learn from numpy.core.mul...

Pycaret - 在 model_tune() 中设置n_jobs

作者:Carl C 提问时间:8/22/2023

我想通过指定参数来使用多处理n_jobssklearn.model_selection.RandomizedSearchCV 我想通过包装器来指定这一点。pycaretpycaret.classif...

结合 minmaxscaler.partial_fit 和 joblib 并行,n_samples_seen_不是累积样本

作者:Jonathan Roy 提问时间:9/27/2023

我使用多处理来训练 sklearn minmax 缩放器。 我有大量的 csv 需要考虑,所以我使用 ..partial_fit 一切似乎都运行良好,但最后当我检查我的洁牙机时,我发现了奇怪的事情。...

BinningProcess:binning_transform_params参数中的错误,metric = bins

作者:hexolitemax 提问时间:9/25/2023

我想使用 BinningProcess 来转换 sklearn 管道中的列。但是,我希望 BinningProcess 返回 bins 而不是目标变量的平均值,以获得有意义的 bin 名称。 为了说...


共87条 当前第8页