pandas 问答列表

如何使用归一化标记透明度创建散点图

作者:VERBOSE 提问时间:9/29/2023

我有这个数据帧: import pandas as pd import matplotlib.pyplot as plt rng = np.random.default_rng(seed=111)...

有没有办法将 pd.cut() 中的cut_bins值保存和使用到不同的文件中

作者:SM079 提问时间:9/30/2023

我正在使用 pd.cut() 对 df 中的数字列进行装箱,如下所示 train_df['bucket'], cut_bins = pd.qcut(train_df['rank'] , q=10, ...

计算具有重复值的 pandas 数据集中的时间戳

作者:Niloofar Nazemi 提问时间:9/30/2023

我有一个包含 IP、URL ID 和时间戳列的数据集。IP 列包含各种 IP,每个 IP 都有一个或多个 URL ID 作为目标。多个 IP 可以与目标共享相同的 URL,并且 IP 到达 URL 并...

在一系列 CSV 上循环函数

作者:kyle stegman 提问时间:9/30/2023

我这里有代码来查找强度图中特定峰的平均大小和stdev。我让它适用于单个文件,但我希望能够一次运行多个文件并将平均值和 stdev 合并为一个平均值和一个 stdev。我一直在使用目录让它工作时遇到问...

在O(N)时间复杂度或更高的情况下,从熊猫数据帧中查找最接近的元组对(在容差范围内)

作者:Stan 提问时间:9/30/2023

我面临的问题可能在循环中可以实现,但是,我需要找出一个具有最大 O(N) 时间复杂度的 pythonic 解决方案: 所以问题是这样的: 我有一个数据帧(我称之为查找)说如下:(它可能是一个非常大...

数据帧中的字符串与具有多个匹配选项的其他数据帧的文本匹配

作者:Benjamin Allen 提问时间:9/29/2023

我有一个数据帧 (df),其值位于“国家/地区”列中,我希望使用另一个名为“country_codes”的数据帧对其进行标准化。df 中的值可以与“country_codes”中的任何项目匹配,但生成...

尝试在 Python 中调整阿拉斯加和夏威夷以适应县级地图

作者:The Mad Scientist 提问时间:10/2/2023

我需要为整个美国制作一张分区统计线县级地图。我现在的问题是,我无法调整阿拉斯加和夏威夷,使它们位于地图的左下角,加利福尼亚州下方和德克萨斯州的左侧。到目前为止,我的计划如下,但它没有对阿拉斯加和夏威夷...

预期的 2D 阵列,得到 1D 阵列,而不是使用 SciKit 进行图像分类

作者:Ginger 提问时间:10/2/2023

我正在尝试使用 .我的数据库包含 656 张图像以及来自 csv 文件的标签。下面是我用来导入图像 + 标签以及调用/创建模型的代码。scikit-learn from numpy.core.mul...

已使用 pd.concat,但仍触发“PerformanceWarning: Dataframe is highly fragmented”

作者:user16865829 提问时间:9/26/2023

我在Python pandas中遇到了一个奇怪的行为。为了防止“Dataframe is highly fragmented”警告,我已经使用了 pd.concat。但在那之后,当我在连接的数据帧中再...

Python39 和 pymysql

作者:Derek_P 提问时间:10/4/2023

我刚刚尝试从 3.9.5 升级到 python3.7,但我遇到了一个我无法完全确定的奇怪行为。它涉及 pandas1.3 和 pymysql1.1.0。奇怪的是,数据帧的长度是相同的,但在 3.9 执...


共852条 当前第52页