K-Means 问答列表

训练随机森林分类器:对单个测量文件进行大规模排序

作者:Derbengale 提问时间:10/25/2023

我有一个旧的但不能完美工作的随机森林分类器,我想用它来改进,我已经对 3000 个文件进行了预分类,所以我有一个文件夹(包含一个“坏”和“好”文件夹),其中 90% 的测量值被正确分类。 我想改进我...

如何将住得很近(但不要太近)的人聚集在一起?[关闭]

作者:PParker 提问时间:10/15/2023

已关闭。这个问题需要更加集中。它目前不接受答案。 想改进这个问题吗?更新问题,使其仅通过编辑这篇文章来关注一个问题。 上个月关闭。 改进此问题 我有什么: 我有一个带有列的 pandas 数...

基于具有约束的空间坐标对人员进行聚类

作者:PParker 提问时间:10/19/2023

我有一个熊猫数据帧。列 和 表示人员的空间坐标。dflatitudelongitude import pandas as pd data = { "latitude": [49.5619579, ...

比较 scikit-learn 版本 1.2.2 和 1.3.1 之间的 k 均值聚类结果

作者:Yin 提问时间:10/18/2023

我在 Python 中使用 scikit-learn 进行 k-means 聚类时遇到了一个问题,其中 1.2.2 和 1.3.1 版本之间的聚类结果似乎不一致。 当我将聚类数 (k) 设置为 3 ...

R 文本聚类(单词属于哪个聚类)

作者:Vincent ISOZ 提问时间:8/15/2023

我从这里获取了以下文本聚类代码脚本: https://medium.com/@SAPCAI/text-clustering-with-r-an-introduction-for-data-scien...

在 Python 和 NumPy 中量化正态分布的浮点数

作者:Stand with Gaza 提问时间:7/31/2023

让数组中的值从高斯采样 分配。我想用“代表”之一替换每个值,以便总量化误差为 最小 化。AAn_RR 下面是执行线性量化的 NumPy 代码: n_A, n_R = 1_000_000, 256 ...

版本 0.22.2 和 1.2.2 之间具有相同random_state的不同集群结果

作者:Okorimi Manoury 提问时间:7/31/2023

我正在处理一个聚类问题。为了确保结果的可重复性,我们最初将参数设置为 0。但是,将scikit-learn从版本0.22.2更新到版本1.2.2后,我遇到了一个意外的问题。当我使用相同的数据集运行相同...


共17条 当前第2页