操作 数据 问答列表

数据整理扩大和整合行

作者:Samuel Priestley 提问时间:4/4/2023

我想加宽一些行,然后使用 R 合并这些行。 组 ID 人 角色 盈利 group_1 person_1 一个 10 group_1 person_2 B 20 group_2 person_3 一个...

熊猫reset_index后groupby.value_counts()

作者:muon 提问时间:9/30/2016

我正在尝试按一列分组并计算另一列的值计数。 import pandas as pd dftest = pd.DataFrame({'A':[1,1,1,1,1,1,1,1,1,2,2,2,2,2],...

根据 R 中现有列中的条件创建一个新列?

作者:Ahsk 提问时间:2/25/2023

我每天都有天气记录。我需要根据现有列和 创建新列。对于每年,我都需要计算温度/湿度/风速值值的每个唯一组合的暴露持续时间。例如,我想知道 2006 年记录了多少天mean_ws?mean_rhmean...

根据大型、不整洁的数据集的列中的先前条目提取特定行

作者:Ben Smith 提问时间:2/8/2023

我有一个相当不整洁的大型数据集,可以通过以下代码大致近似。 set.seed(1) col_1 <- c(rep(c(1888:1891), each = 50), rep(c(1892:1895)...

将不同长度的长格式数据帧组合并转换为宽格式

作者:cliu 提问时间:11/27/2021

由于变量(不平衡的面板数据),我想将长格式的数据帧组合成不同的长度:time set.seed(63) #function to create a data frame that includes ...

为 r 中的两个条件分组的多个列创建滞后变量

作者:cliu 提问时间:2/7/2023

我想为按两个条件分组的几列创建滞后变量。 下面是数据集: df <- data.frame(id = c(rep(1,4),rep(2,4)), tp = rep(1:4,2), x1 = 1:8...

根据匹配的字符串分配站点名称(不分隔地址)

作者:Banji 提问时间:1/5/2023

我正在尝试根据一些匹配条件分配 SiteName。我已经使用以下步骤完成了任务,我想知道如果没有“分开”和“pivot_longer”功能,我是否可以获得相同的结果 法典: df <- tibb...

如果 A 列中的任何值大于 R 中的 B 列,在面板中的某个点之后,如何分配虚拟变量?

作者:Anna 提问时间:9/23/2022

我有一个 2003 年至 2021 年间工人的不平衡面板数据集。它由 PersonID 使用 plm 包设置。 我想生成一个虚拟变量,用于说明工人在失业后是否在学校就读。 编码标准为: 每组(又...

如何在 Jupyter python 中计算截至快照日期的最近 3 个月平均增长率?

作者:Nupur Jain 提问时间:9/19/2022

我有一个数据集,如下所示,我们希望遵循基于快照的方法(即截至数据集中的 3 个快照日期,性能如何)。抱歉,我是jupyter(Python)的新手 客户 ID 报告日期 快照日期 借方数 学分数 C...

替换 pandas 数据帧中的值

作者:Hemant Sain 提问时间:6/13/2022

我有一只熊猫,它是根据事件生成的。每个事件都有一个唯一的 ID,它会在 DataFrame 中生成重复的行。dataframe 问题在于,这些重复行中的一些包含随机值,因为它们彼此不同。 我需要根...


共27条 当前第2页