如何使用 groupby() 按日和月对跨越多年的数据进行分组?
作者:Bennett_Eleven 提问时间:11/12/2023
我有一个跨越多年的数据集。一年中的每一天都有多个数据条目。我想按一年中的某一天分组。即日月,然后使用 agg() 找到最大值,这样我就剩下 365 行了。 我的方法是创建一个新列,该列采用格式为 y...
dataframe 问答列表
作者:Bennett_Eleven 提问时间:11/12/2023
我有一个跨越多年的数据集。一年中的每一天都有多个数据条目。我想按一年中的某一天分组。即日月,然后使用 agg() 找到最大值,这样我就剩下 365 行了。 我的方法是创建一个新列,该列采用格式为 y...
作者:ps_tw 提问时间:11/8/2023
我有(很多)时间序列数据,在离散的时间柱上建立索引,我正在重新索引和插值以使它们保持一致。 例如: # index of (time) series idx_2 = [1, 2, 3, 5, 10...
作者:Hannah 提问时间:11/13/2023
我有一个 DataFrame df: 开盘 最高价 最低价 收盘价 187100 187100 187100 188100 188000 188000 188000 188000 188000 18...
作者:Joao Coelho 提问时间:11/13/2023
这只是提取美元报价和变化的简单代码。导出到 excel 时,我得到了一个具有相同值的附加行。 如何消除此双 excel 条目? import requests from bs4 import Be...
作者:user242318 提问时间:11/13/2023
我有一个PD。以 MultiIndex 作为索引的 DataFrame df。当我按第一级分组时,如何获得第二级 MultiIndex 作为索引?groupby 对象是 gdf = df.group...
作者:star 提问时间:11/12/2023
我有一个如下所示的 AAString 集,如何从 seq 列中子集区域。 df <- AAStringSet(c("MEKIVLLLA", "MEKIVLDIA")) 输入: df: AAS...
作者:rizac 提问时间:11/16/2023
当访问多索引列 DataFrame 上的数据时,pandas (v. 2.1.3) 似乎“跳过”子级别中的空字符串(如果没有歧义的话? >>> df A B 1 # <- empty strin...
作者:Anjali 提问时间:11/16/2023
我有一本字典,如{'abc':'123','cde':'456','':'fgh':'789'}。我想将其存储到 databricks 中的增量表中。有关预期结果,请参阅图像。 如何实现这一点。 我尝...
作者:user22927025 提问时间:11/16/2023
代码背景:对于我的项目,我有相当大的数据集,我需要处理和计算每个数据集的单个值。我的代码以这样的方式工作,我只需要填写一个示例位置编号,并且无需再更改代码本身中的任何内容即可计算所有内容。 问题:我...
作者:Laudine Carbuccia 提问时间:11/16/2023
我有一个数据帧,对应于我的研究助理每天工作的小时数。它看起来像这样: structure(list(SurveyorId = c("Zineb", "Elisa", "AudreyB", "Cami...