提问人:Soyoko Umeno 提问时间:6/8/2023 更新时间:6/8/2023 访问量:51
Python Record Linkage Toolkit - 如何检索比较器值
Python Record Linkage Toolkit - how to retrieve comparator values
问:
我正在使用 Python 的名称匹配工具 recordlinkage
有谁知道如何从这个算法中检索比较器值?
例如,在运行以下代码时,按照此链接 https://pbpython.com/record-linking.html 中的示例“方法 2 - Python 记录链接工具包”进行操作:
features = compare.compute(candidates, hospital_accounts, hospital_reimbursement)
有没有办法通过计算一对中名称之间的相似性来保存和重新运行比较器值?
根据这个 Python 文档 https://recordlinkage.readthedocs.io/en/latest/ref-compare.html,recordlinkage.compare.string 使用以下方法来计算相似度:
method (str, default 'levenshtein') - 一种近似的字符串比较方法。选项包括 ['jaro', 'jarowinkler', 'levenshtein', 'damerau_levenshtein', 'qgram', 'cosine', 'smith_waterman', 'lcs']。默认值: 'levenshtein'
有什么方法可以从这个计算中检索值吗?
谢谢
答: 暂无答案
评论