dataframe 问答列表

在 Pandas 中重命名列名

作者:user1504276 提问时间:7/5/2012

我想将 Pandas DataFrame 的列标签从 ['$a', '$b', '$c', '$d', '$e'] 自 ['a', 'b', 'c', 'd', 'e'] ...

重构 Gamble 数据库以进行比较

作者:DataDude 提问时间:9/6/2023

对于一个副业项目,我正在考虑比较 2 家博彩机构的赔率,并且很难将这些信息以正确的格式放入我的表格中。 目前我有下表: 供应商 投注类型 结果标签 赔率 机构 A 一个 高于 1.5 1.3 机构...

如何使用 Python 在 Excel 中操作表格

作者:zakalaka 提问时间:9/5/2023

我在 Excel 中具有以下加载配置文件作为 .xlsx:加载配置文件 在 A 列中,日期和时间戳以 DD.MM.YYYY hh:mm 格式输入。这是用户定义的格式。如果没有此格式,表格将如下所示:...

有没有一种优雅的方法可以根据 R 中的共享变量对行进行求和和合并?[复制]

作者:Walker Weyland 提问时间:9/1/2023

这个问题在这里已经有答案了: 使用 dplyr 汇总多个列?[复制] (5 个答案) 按多列分组并对其他多列求和 (7 个答案) 3个月前关闭。 我确定我错过了一些简单的东西,但我有一个数据框,看起...

将孙子 XML 解析为 pandas 数据帧

作者:ChemEnger 提问时间:8/31/2023

我看过各种问题和答案,但没有一个能完全满足我的需求。 我有格式的xml平面文件(由硬件SCADA系统生成)(编辑:之前草率的复制和粘贴,现在用第二个修复,并且有空字段):<row></STATUS>...

有关使用 loc 方法基于现有列创建新列的问题

作者:Red shoes 提问时间:8/30/2023

我有两个名为 df 和 df2 的数据帧,行数相同。我想根据一些逻辑比较在 df 中创建一个新列,如下所示 df['new_col']='nothing' df.loc[(df2['col2']....

R 中学生的交互效应

作者:thedumbkid 提问时间:8/29/2023

我正在 R 中使用数据集 df1。它有两列:日期和Student_ID。我首先想找出在某个日期一起出现的学生对数。假设这些学生对位于 V 列中。现在,我想创建一个包含 V 列的数据帧,以便对应于每个日...

如何使用 StringIO(file.read()) 创建 Spark 数据帧

作者:Eliu 提问时间:11/17/2023

我有一个非常简单的csv文件。通过以下方式将记录加载到 pandas 数据帧中非常容易。 但是,我真正需要的是将其加载到 spark 数据帧中。 如何直接使用 StringIO(f.read()) ...

如何修复 ParserError:年份 0 超出范围:0000-00-00 使用 Python Pandas to_datetime方法

作者:JA-pythonista 提问时间:2/11/2020

我正在尝试将列“travel_start”转换为日期时间对象。 Dashboard["travel_start"] = pd.to_datetime(Dashboard["travel_start"...

同一列中的字符串数据匹配 - R

作者:maldini1990 提问时间:8/10/2023

我有一个个人工作数据集以及一些关于某些职业工资的信息,我正在尝试创建一个子集,通过模糊匹配来标准化工作名称。具体来说,月薪为 4000 美元的名为“成本会计师”的职位和 5000 美元的“财务会计师”...


共265条 当前第6页