R:如何基于不完全相同的模糊匹配字符串左连接两个表
作者:Pxanalyst 提问时间:7/20/2023
我正在尝试将表 1“人名”左联接到表 2“姓名”,并从表 2 的“工作组”列中获取值 df1 <- read.table(text=" Person_Name PEREZ, MINDY PEREZ,...
数据帧 问答列表
作者:Pxanalyst 提问时间:7/20/2023
我正在尝试将表 1“人名”左联接到表 2“姓名”,并从表 2 的“工作组”列中获取值 df1 <- read.table(text=" Person_Name PEREZ, MINDY PEREZ,...
作者:Pranab 提问时间:7/22/2023
我有以下数据帧 import pandas as pd data = [[5,4,3,2,6,8], [9,1,5,4,8,6], [7,6,8,1,2,4], [9,6,5,4,8,3]] df ...
作者:rasputin 提问时间:7/14/2023
我正在尝试为 pandas 数据框中的每个观察值添加一年,直到每个观察值都在指定的日期范围内。 for i in range(0,3): df.loc[df['date'] < "2023-06...
作者:Mohamed Rahouma 提问时间:7/23/2023
我需要将事件级数据集转换为患者级数据,即将长数据集转换为更宽的数据集,作为关键变量。此外,我想为每个生成的事件及其事件时间创建列。如果同一患者有多个事件,请考虑最早的事件时间。deidnum 下面是...
作者:Hüseyin CENİK 提问时间:7/20/2023
祝你工作顺利。你能回答我的问题吗?谢谢 两个分类变量之间的卡方 p 值是否显示分类变量的相关性?当我们比较 p 值时,我们能说小 p 值高度相关吗? 我比较了分类特征的卡方检验结果。我想通过采用相关...
作者:shizzle 提问时间:7/27/2023
在这种情况下,是否真的可以跳过不存在的值,例如 colnames?(例如 不存在dplyr::coalesce()col2data) data %>% mutate( var_1 = coale...
作者:PhE 提问时间:5/23/2012
如何创建一个空的,然后逐个添加行?DataFrame 我创建了一个空的:DataFrame df = pd.DataFrame(columns=('lib', 'qty1', 'qty2')) ...
作者:MikeTP 提问时间:3/22/2012
我有一个数据帧,我想计算每个组中的行数。我经常使用该函数对数据求和,如下所示:aggregate df2 <- aggregate(x ~ Year + Month, data = df1, sum...
作者:r0ck 提问时间:8/1/2023
可能是一个愚蠢的问题,但我很新。我有两个单独的大型(几百万行)csv,我正在尝试使用数据帧功能进行比较,由于我的入职方式,我目前正在两个单独的程序中清理它们。是否可以合并两个数据帧(一旦它们被清理出来...
作者:user6118986 提问时间:7/28/2023
我有可以包含布尔值和整数混合的数据帧,我希望能够做这样的事情,并保证如果为 1,它不会与 中的值匹配。df_1 == df_2.loc[0,0]df_2.loc[0,0]Truedf_1...