stringdist 问答列表

使用 -matchit- 命令使用模糊字符串比较进行数据合并和清理

作者:Mariama Drame 提问时间:1/20/2023

我有两个数据库,一个是指定数据,另一个是数据1(参考),我想比较每个数据名称和数据2的代码,我必须通过编写名称来做到这一点,如果它们写得相同或相似,我必须有相同的代码,但他可以找到字典数据库中多行相同...

使用模糊字符串匹配在文本字符串上联接数据帧 (stringdist_join())

作者:JRock 提问时间:3/7/2023

我正在尝试根据两个变量的值连接两个数据集。两个数据集具有相同的变量名称/列数,但可能具有不同的行数。我想根据分组变量(“SampleID”)和包含文本字符串的变量(“PrimConstruct”)加入...

修复 fuzzyjoin 错误消息:矢量内存耗尽

作者:yankees_fan 提问时间:4/14/2023

我正在尝试通过库模糊连接中的stringdist_left_join函数使用模糊匹配连接两个数据集,但我不断收到错误消息“错误:矢量内存耗尽(达到限制?有谁知道为什么会发生这种情况?我不会说这两个数据...

在 R 中快速高效地提取和比较子字符串

作者:Nils R 提问时间:10/10/2023

我有一个问题,即在我的数据集中两个字符串的子字符串之间非常快速有效地进行比较,尽管有非常强大的机制,但它的运行速度不够快。 我有一个 2 列和大约 15 亿行,它具有以下结构:data.table ...


共4条 当前第1页