数据整理扩大和整合行
作者:Samuel Priestley 提问时间:4/4/2023
我想加宽一些行,然后使用 R 合并这些行。 组 ID 人 角色 盈利 group_1 person_1 一个 10 group_1 person_2 B 20 group_2 person_3 一个...
操作 数据 问答列表
作者:Samuel Priestley 提问时间:4/4/2023
我想加宽一些行,然后使用 R 合并这些行。 组 ID 人 角色 盈利 group_1 person_1 一个 10 group_1 person_2 B 20 group_2 person_3 一个...
作者:muon 提问时间:9/30/2016
我正在尝试按一列分组并计算另一列的值计数。 import pandas as pd dftest = pd.DataFrame({'A':[1,1,1,1,1,1,1,1,1,2,2,2,2,2],...
作者:Ahsk 提问时间:2/25/2023
我每天都有天气记录。我需要根据现有列和 创建新列。对于每年,我都需要计算温度/湿度/风速值值的每个唯一组合的暴露持续时间。例如,我想知道 2006 年记录了多少天mean_ws?mean_rhmean...
作者:Ben Smith 提问时间:2/8/2023
我有一个相当不整洁的大型数据集,可以通过以下代码大致近似。 set.seed(1) col_1 <- c(rep(c(1888:1891), each = 50), rep(c(1892:1895)...
作者:cliu 提问时间:11/27/2021
由于变量(不平衡的面板数据),我想将长格式的数据帧组合成不同的长度:time set.seed(63) #function to create a data frame that includes ...
作者:cliu 提问时间:2/7/2023
我想为按两个条件分组的几列创建滞后变量。 下面是数据集: df <- data.frame(id = c(rep(1,4),rep(2,4)), tp = rep(1:4,2), x1 = 1:8...
作者:Banji 提问时间:1/5/2023
我正在尝试根据一些匹配条件分配 SiteName。我已经使用以下步骤完成了任务,我想知道如果没有“分开”和“pivot_longer”功能,我是否可以获得相同的结果 法典: df <- tibb...
作者:Anna 提问时间:9/23/2022
我有一个 2003 年至 2021 年间工人的不平衡面板数据集。它由 PersonID 使用 plm 包设置。 我想生成一个虚拟变量,用于说明工人在失业后是否在学校就读。 编码标准为: 每组(又...
作者:Nupur Jain 提问时间:9/19/2022
我有一个数据集,如下所示,我们希望遵循基于快照的方法(即截至数据集中的 3 个快照日期,性能如何)。抱歉,我是jupyter(Python)的新手 客户 ID 报告日期 快照日期 借方数 学分数 C...
作者:Hemant Sain 提问时间:6/13/2022
我有一只熊猫,它是根据事件生成的。每个事件都有一个唯一的 ID,它会在 DataFrame 中生成重复的行。dataframe 问题在于,这些重复行中的一些包含随机值,因为它们彼此不同。 我需要根...