数据帧 问答列表

按指数逐元素乘以 pandas

作者:Tyler D 提问时间:3/2/2019

我有两个数据帧和:df1df2 df1 = pd.DataFrame({"a" : [1,2,3,4,5,6,7,8,9,10,11,12], "b" : [-1,-2,-3,-4,-5,-6,-...

将季度数据帧转换为每月数据帧,并填充每个 ID 的缺失值

作者:Tyler D 提问时间:9/3/2021

我有一个数据帧,对于每个 ID,它都包含一个时间戳和一个值。时间戳是给定季度的时间戳: import pandas as pd a = pd.DataFrame({'id': [1,1,1,1,1,...

根据 if 条件创建新列并为其赋值

作者:spacedustpi 提问时间:4/18/2018

我有一个数据帧: 我想遍历它以检查它是否是 NLTK 支持的引用中的单词。在 if 语句中,我想创建一个名为“bool”的新列,并根据引用的好坏分配 true 或 false。我写了下面的代码,出于...

pyspark/Synapse/python -- 数据帧联合运行缓慢

作者:Wasim Syed 提问时间:11/7/2023

我有六个数据帧的联合,每个数据帧有近 200 列。所有 6 个数据帧中所有记录的总和为 90,000 条记录。工会需要 15 分钟以上才能完成。 我尝试过在数据帧上缓存(),也尝试过覆盖数据帧以临时...

pyspark 尝试写入 csv 文件时出现 EOF 错误

作者:Caelia 提问时间:7/11/2023

我使用 pyspark 合并了 4 个表,合并过程完成。然后我尝试将数据帧转换为 csv 文件。但是,我收到 EOF 错误。 我尝试合并较小的表,但没有发生此错误。不确定它是否与记忆或其他有关。 ...

获取数据集中 null 值的计数

作者:B.h.1999 提问时间:8/16/2023

要求是,我们需要检查数据集中的重复值,并返回以整数形式返回的重复值的计数。 我已经编写了这段代码,但出现以下错误: def check_duplicates(): ds = pd.read_cs...

如何从数据帧中的字符串中提取日期 [duplicate]

作者:Lok 提问时间:6/17/2023

这个问题在这里已经有答案了: 从字符串 Pandas 数据帧中提取日期 (1 个答案) 如何判断 pandas 数据帧中的列是否为 datetime 类型?如何判断一列是否为数字? (6 个答案) 5...

如果数字或字符串与两个数据帧 R 匹配,则在新列中计数器

作者:Usman YousafZai 提问时间:6/20/2023

我将尝试给出一个最好的例子来理解。我有两个数据帧:df1 和 df2。在下面的数据帧中,如果来自 df1 的Drug_Code_1与来自 df2 的Drug_Code_2匹配,则应在 df1 中创建一...

如何找出哪些值对应于另一个数据帧中的范围?[复制]

作者:Redesfist 提问时间:9/6/2023

这个问题在这里已经有答案了: 在数据名望 2 中从数据帧 1 中查找接近匹配 (1 个答案) 在 R 中按时间范围合并两个数据帧 (2 个答案) 3个月前关闭。 我正在尝试找出我的一个数据帧中的哪些...

为什么在两个数据帧之间按元素划分,每个数据帧一列,结果为 NaN,两列?

作者:jjw 提问时间:9/5/2023

import pandas as pd df0 = pd.DataFrame({'a': [864371.0, 864383.0, 864364.0, 864381.0, 864364.0]}) ...


共505条 当前第13页