训练随机森林分类器:对单个测量文件进行大规模排序
作者:Derbengale 提问时间:10/25/2023
我有一个旧的但不能完美工作的随机森林分类器,我想用它来改进,我已经对 3000 个文件进行了预分类,所以我有一个文件夹(包含一个“坏”和“好”文件夹),其中 90% 的测量值被正确分类。 我想改进我...
K-Means 问答列表
作者:Derbengale 提问时间:10/25/2023
我有一个旧的但不能完美工作的随机森林分类器,我想用它来改进,我已经对 3000 个文件进行了预分类,所以我有一个文件夹(包含一个“坏”和“好”文件夹),其中 90% 的测量值被正确分类。 我想改进我...
作者:PParker 提问时间:10/15/2023
已关闭。这个问题需要更加集中。它目前不接受答案。 想改进这个问题吗?更新问题,使其仅通过编辑这篇文章来关注一个问题。 上个月关闭。 改进此问题 我有什么: 我有一个带有列的 pandas 数...
作者:PParker 提问时间:10/19/2023
我有一个熊猫数据帧。列 和 表示人员的空间坐标。dflatitudelongitude import pandas as pd data = { "latitude": [49.5619579, ...
作者:Yin 提问时间:10/18/2023
我在 Python 中使用 scikit-learn 进行 k-means 聚类时遇到了一个问题,其中 1.2.2 和 1.3.1 版本之间的聚类结果似乎不一致。 当我将聚类数 (k) 设置为 3 ...
作者:Vincent ISOZ 提问时间:8/15/2023
我从这里获取了以下文本聚类代码脚本: https://medium.com/@SAPCAI/text-clustering-with-r-an-introduction-for-data-scien...
作者:Stand with Gaza 提问时间:7/31/2023
让数组中的值从高斯采样 分配。我想用“代表”之一替换每个值,以便总量化误差为 最小 化。AAn_RR 下面是执行线性量化的 NumPy 代码: n_A, n_R = 1_000_000, 256 ...
作者:Okorimi Manoury 提问时间:7/31/2023
我正在处理一个聚类问题。为了确保结果的可重复性,我们最初将参数设置为 0。但是,将scikit-learn从版本0.22.2更新到版本1.2.2后,我遇到了一个意外的问题。当我使用相同的数据集运行相同...