pan 问答列表

有没有办法使用 pandas str.replace 仅在单词单独出现时替换它,而不是作为较长字符串的一部分?

作者:mggo256 提问时间:9/27/2023

我有一个数据帧,当它作为数据帧中的单个项目/单元格/条目单独出现时,我只想替换“Blah”——而不是作为像“Blah guh”这样的较长字符串的一部分。请参阅以下示例: data={"Col":["...

OperationalError:(sqlite3.OperationalError) SQL 变量过多,同时将 SQL 与数据帧一起使用

作者:Sarang Manjrekar 提问时间:5/24/2018

我有一个熊猫数据帧,如下所示。 activity User_Id \ 0 VIEWED MOVIE 158d292ec18a49 1 VIEWED MOVIE 158d292ec18a49 2...

'pd.date_range()'如何在不调用'DatetimeIndex'类的任何方法的情况下创建'DatetimeIndex'的对象?

作者:IRON MAN 提问时间:9/28/2023

这是我正在使用的 csv 文件,它以 day 列作为索引 temperature windspeed event day 2017-01-01 32.0 6.0 Rain 2017-01-04 ...

C++23(或更高版本)使用索引向量提取数组元素的简洁方法?

作者:Astor 提问时间:9/28/2023

我一直在研究使用最新标准对阵列进行切片的新方法,但这有点让人不知所措,我有一个问题。 有没有新的、简洁的方法,通过新的 C++23 添加到 、 、 甚至即将到来的 , ,使用带有要提取索引的向量将 ...

如何使用归一化标记透明度创建散点图

作者:VERBOSE 提问时间:9/29/2023

我有这个数据帧: import pandas as pd import matplotlib.pyplot as plt rng = np.random.default_rng(seed=111)...

有没有办法将 pd.cut() 中的cut_bins值保存和使用到不同的文件中

作者:SM079 提问时间:9/30/2023

我正在使用 pd.cut() 对 df 中的数字列进行装箱,如下所示 train_df['bucket'], cut_bins = pd.qcut(train_df['rank'] , q=10, ...

计算具有重复值的 pandas 数据集中的时间戳

作者:Niloofar Nazemi 提问时间:9/30/2023

我有一个包含 IP、URL ID 和时间戳列的数据集。IP 列包含各种 IP,每个 IP 都有一个或多个 URL ID 作为目标。多个 IP 可以与目标共享相同的 URL,并且 IP 到达 URL 并...

在一系列 CSV 上循环函数

作者:kyle stegman 提问时间:9/30/2023

我这里有代码来查找强度图中特定峰的平均大小和stdev。我让它适用于单个文件,但我希望能够一次运行多个文件并将平均值和 stdev 合并为一个平均值和一个 stdev。我一直在使用目录让它工作时遇到问...

在O(N)时间复杂度或更高的情况下,从熊猫数据帧中查找最接近的元组对(在容差范围内)

作者:Stan 提问时间:9/30/2023

我面临的问题可能在循环中可以实现,但是,我需要找出一个具有最大 O(N) 时间复杂度的 pythonic 解决方案: 所以问题是这样的: 我有一个数据帧(我称之为查找)说如下:(它可能是一个非常大...

数据帧中的字符串与具有多个匹配选项的其他数据帧的文本匹配

作者:Benjamin Allen 提问时间:9/29/2023

我有一个数据帧 (df),其值位于“国家/地区”列中,我希望使用另一个名为“country_codes”的数据帧对其进行标准化。df 中的值可以与“country_codes”中的任何项目匹配,但生成...


共978条 当前第59页