哪种算法可以匹配集合中最相似的字符串?
作者: 提问时间:1/13/2018
假设我有一个包含书名的书籍数据库。对于来自 eBay 或 Craigslist 或其他类似网站的给定列表,我想将其标题字符串与我数据库中的所有书名进行比较,以尝试找到匹配项。 不太可能有确切的字符串...
n-gram 问答列表
作者: 提问时间:1/13/2018
假设我有一个包含书名的书籍数据库。对于来自 eBay 或 Craigslist 或其他类似网站的给定列表,我想将其标题字符串与我数据库中的所有书名进行比较,以尝试找到匹配项。 不太可能有确切的字符串...
作者:Rastko M. 提问时间:5/21/2023
我在过滤我的二元图时遇到问题,以便它包含一个特定的单词。代码如下: light_df$text %>% unnest_tokens(word, text, token = "ngrams", n...
作者:Enzo Ferrari 提问时间:10/20/2023
我不知道你们中的许多人是否曾经使用过库语言工具的这个 python 包装器。 正如我所读到的,与其 API 相比,languagetool 本身无法检测它应该检测的所有错误。这是因为它需要 n-gra...
作者:fatemeh khoshhal 提问时间:11/16/2023
名称“tokenize_2grams”未定义 你能告诉我这个函数(tokenize_2grams)的库是什么吗? tokenize_2grams("Thomas Jefferson began b...