使用 fuzzywuzzy 库根据特定列查找 pyspark 数据帧的相似行
作者:DonkeyKong 提问时间:8/17/2023
我正在尝试根据特定列在数据帧中查找“相似”行。例如,假设我们有这个数据—— +---+------+ | id| fruit| +---+------+ | 1| apple| | 2| appl|...
pyspark-pandas 问答列表
作者:DonkeyKong 提问时间:8/17/2023
我正在尝试根据特定列在数据帧中查找“相似”行。例如,假设我们有这个数据—— +---+------+ | id| fruit| +---+------+ | 1| apple| | 2| appl|...