Pandas 问答列表

如何按列集分组,也按列分组,并按其项目组合和值列上的聚合进行分组?

作者:Rac 提问时间:9/9/2023

这是数据帧 df = pd.DataFrame({'county':['Laramie']*10 + ['Albany']*12, 'co': ['LU']*22, 'tech':['cable...

如何更正此代码以不引发 SettingWithCopyWarning?

作者:TransitoryGouda 提问时间:6/16/2023

我正在关注这个:https://www.kdnuggets.com/2021/01/cleaner-data-analysis-pandas-pipes.html 大约在一半的时候,作者创建了一个函...

从数据帧中提取数字后,如何统一转换为一个计量单位后计算平均价格

作者:X.x 提问时间:9/10/2023

我有一个数据集,其中包含不同的房产租金价格。它看起来像这样: data = { 'prices': [ '$350.00', '$450.00 pw', '$325 per week', ...

提取字符串中撇号后的数字 [duplicate]

作者:Will Graham 提问时间:9/11/2023

这个问题在这里已经有答案了: 从特定字符后面的字符串中提取数字 (2 个答案) 正则表达式在匹配模式后获取数字 (3 个答案) 2个月前关闭。 我正在寻找一种方法来提取字符串中撇号后的数字。 示例...

如何在 pandas 数据帧中创建 4 年周期的日数?

作者:Markus W 提问时间:9/11/2023

我有带有日期时间索引、价格和周期阶段的时间序列数据。 我的数据帧如下所示: 日期索引 价格 循环阶段 日 1928-01-03 00:00:00 71.04 0 1 1928-01-04 00:00...

Tabula pd df 损失数据

作者:Fellipe Zambrano 提问时间:9/10/2023

我需要从 PDF 文件中获取表格。 代码是: pdf=tabula.read_pdf(arquivo, pages=(1,2), lattice=True) 我将两个 df 转换为列表,如下所示...

在 Snowflake 中连接最近的几何图形

作者:ffi23 提问时间:9/11/2023

我想根据两个 Snowflake 表的 X,Y(经度,纬度)坐标连接它们。 两个表中的每一行都是一个点,我想将表A中的每一行连接到表B中最近的点。 在 Python 中,GeoPandas 模块具...

如何使用 pandas 删除从网站抓取的 csv 文件中的符号

作者:عمر عيسى 提问时间:9/13/2023

我正在尝试分析航空公司评论,这是一个仅包含评论文本的单列数据帧,不幸的是,存在一个勾号✅和特殊字符 |在每一行中显示行程是否已验证,然后 |似乎将注释和验证语句分开,我想删除验证文本和符号。 dat...

Python 中的函数,用于遍历列并在满足条件时替换值

作者:user3641630 提问时间:9/15/2023

我想创建一个计算列 A-C 的函数。如果行值为 Type,后跟 A、B、C,则将这些列中的值替换为 “”。如果替换了一个值,我想创建一个名为“Replaced”=1 的列。 下面是创建 df 的代码...

Pandas 2.1.0 FutureWarning:不推荐Series.__getitem__将键视为位置

作者:Zach Morris 提问时间:9/15/2023

我在使用 Pandas v2.1.0+ 时遇到了无法解决的问题。 我的 pandas 数据框中有一个列列表,我需要使用自定义函数进行转换。新值取决于数据中的多个列,因此我使用 apply 就地转换列...


共852条 当前第48页