pandas 问答列表

如何逻辑地组合 pandas DataFrame 列上的数据以生成新的 DataFrame?

作者:Ruan Carlo Weiers Britzke 提问时间:6/16/2023

我制作了一个程序,它返回一个“归属表”DataFrame,该 DataFrame 的 Multigraph 边缘对电网进行建模。 每条线都是荷载和源之间的路径,列是将荷载连接到源的线的名称。 我编写...

后台作业在 2-3 小时后终止,日志上没有任何错误

作者:Rajesh 提问时间:7/25/2023

我正在运行机器学习作业。作业生成 parquet 文件。每个文件大小为 30-40MB。这些文件的总大小为 11-12 GB。 在一段代码下面,我必须创建熊猫数据帧,但这永远不会被执行,工作被杀死。...

尝试根据列表值和 len 动态填充列

作者:Hugoz13 提问时间:7/25/2023

我一直在尝试尽可能地优化由两部分组成的数据操作。我正在处理一个 pandas 列,其中每个值都是具有不同长度或 NaN 值的列表,我想提取这些值以根据它们在列表中的位置将它们放在列上。 这是一个可复...

计算新行特征时更新 pandas 数据帧的惯用方法

作者:harryjulian 提问时间:7/26/2023

我有一个 pandas 数据帧,其中包含时间序列数据行。 我想定义一个函数,可用于在机器学习模型的现有时间序列数据帧(5 列)上计算某些特征(20+ 列)。compute_features(*arg...

Json 到 pd。DataFrame:解析为具有不同时间戳格式的日期时间

作者:sander 提问时间:7/26/2023

我正在处理来自 Google Takeout 的大型 JSON 文件(大约 4000 万行)。数据示例如下图所示。我将数据加载到 a 中,并将时间戳更改为 .时间戳几乎总是采用 的格式,我用它来将时间...

将大型 CSV 文件按组平均拆分为较小的 CSV 文件的更快方法?

作者:GreenGodot 提问时间:7/27/2023

我相信有更好的方法,但我画的是空白。我有一个这种格式的 CSV 文件。ID 列已排序,因此所有内容至少都组合在一起: Text ID this is sample text, AAAA this i...

通过一次追加一行来创建 Pandas DataFrame

作者:PhE 提问时间:5/23/2012

如何创建一个空的,然后逐个添加行?DataFrame 我创建了一个空的:DataFrame df = pd.DataFrame(columns=('lib', 'qty1', 'qty2')) ...

谁能解释一下 Pandas 中的 SettingWithCopyWarning 是什么 [duplicate]

作者:shubham tiwari 提问时间:7/29/2023

这个问题在这里已经有答案了: 如何处理 Pandas 中的 SettingWithCopyWarning (24 个答案) 4个月前关闭。 我是熊猫的新手,在为我的课程做作业时,我遇到了一个警告,上...

Excel 导入数据集的输入和循环

作者:Stefy 提问时间:7/31/2023

我在 excel 上有一个数据集,我想把它放在 python 上。数据集基本上显示了客户的详细信息,我想要的只是一个工具,通过输入客户名称给我他的号码 数据如下所示: 客户名称 客户编号 客户地址...

是否可以合并来自两个独立程序的数据帧?

作者:r0ck 提问时间:8/1/2023

可能是一个愚蠢的问题,但我很新。我有两个单独的大型(几百万行)csv,我正在尝试使用数据帧功能进行比较,由于我的入职方式,我目前正在两个单独的程序中清理它们。是否可以合并两个数据帧(一旦它们被清理出来...


共852条 当前第42页