数据帧 问答列表

使用自动 select 语句将 pyspark 数组解析为列

作者:SunflowerParty 提问时间:3/22/2023

我想将我的数据帧解析到下面列表中的列中。我有两个数据帧:一个模式数据帧包含我将使用的列名,另一个数据格式为数组行。pysparkarray_col 即 schema: cols = ['Brand...

警告:从磁带库 meteostat 加载数据

作者:AffeFridolin 提问时间:3/27/2023

我需要一些大学项目的天气数据。 因此,我使用了库 meteostat,但是当我意识到我的 Python 代码时仍然有一个警告。无论如何,我得到了一个结果。 我该如何处理这种警告? 我的代码: im...

向 pandas 框架添加列时出现性能警告

作者:E. M. 提问时间:3/28/2023

在将多列插入 pandas 数据框后,我遇到以下警告: PerformanceWarning:DataFrame 高度碎片化。这通常是多次调用的结果,性能较差。请考虑改用 pd.concat(axi...

如何使用一个数据帧列中的值更改来计算另一个数据帧列

作者:AndysPythonStuff 提问时间:3/28/2023

假设我有一个数据帧。 第一列是正数,称之为 PRICE。 第二列中的值(称为 MORELESS)只能是 1 或 -1,并且根据当前行中 PRICE 的值是大于 (1) 还是小于 (-1) 上一行中 ...

如何修复 pandas 中的“尝试在 DataFrame 中的切片副本上设置值”警告?

作者:Bogdan Doicin 提问时间:4/6/2023

我有以下Python函数: def compute_average_fg_rating(df, mask=''): df = df[['HorseId', 'FGrating']] if len...

在 R 中比较字符向量中的值

作者:pampi 提问时间:4/7/2023

我有两个数据帧 分类: structure(list(category_code = 1:12, category_name = c("Kanton", "Bezirk", "Gemeind...

如何遍历 Pandas 中列中的列表以找到匹配项?

作者:pheonix 提问时间:4/11/2023

我有一个术语列表,想找出特定单词是否匹配 元 ['家', '杂货店', '蛋糕'] ['家', '杂货店', '饼干', '奥利奥'] 我正在尝试从此列表中找到匹配项: 术语列表 = ['cake...

合并具有数组的数据帧

作者:Avenger 提问时间:4/13/2023

我有两个数据框。 东风1 isActive,trackedSearchId True,53436615 True,53434228 True,53434229 EFS的 trackedSearch...

如何更新 Polars 数据帧中的单个值?

作者:Laurent 提问时间:4/23/2023

在 Pandas 中,您可以使用 at 属性更新值,如下所示: import pandas as pd df = pd.DataFrame({"col1": [1, 2, 3], "col2": ...

选择每个组中具有最大值的行

作者:Xinting WANG 提问时间:7/3/2014

在每个主题具有多个观测值的数据集中。对于每个主题,我想选择最大值为“pt”的行。例如,使用以下数据集: ID <- c(1,1,1,2,2,2,2,3,3) Value <- c(2,3,5,2,5...


共505条 当前第25页