提问人:lnathan 提问时间:2/20/2023 更新时间:3/3/2023 访问量:60
流数据重复数据删除中的地名词典和链接器之间的区别
Difference between the Gazetteer and Linker in Dedupe for Streaming Data
问:
我正在使用重复数据删除包,但无法理解地名词典和链接器之间的区别。我已经阅读了文档,但对我来说似乎有点不清楚。
我已经能够使用重复数据删除器类计算分辨率,但现在我需要处理流数据。具体来说,我需要将传入数据 N+1 与我拥有的现有集群进行匹配,并且我不确定我是否应该为此目的使用地名词典或链接器。
有人能否提供有关如何使用重复数据删除处理流数据的指导,并解释哪个组件最适合此用例?另外,我可以同时使用它们吗?
答: 暂无答案
评论