Python:无法从 PDF 中提取多行“属性地址”

Python: Unable to extract multi-line 'Property Address' from PDF

提问人:Kanjeero boocho 提问时间:10/18/2023 更新时间:10/18/2023 访问量:23

问:

需要您的帮助来编写 python 脚本以从 pdf 文件 MultiLineText 中提取多行文本。这是我尝试使用的小代码: 'Address': r'Property No: (\d+)'

无论我使用哪种正则表达式组合,我都会打空白。需要提取的文本如下所示: 物业编号: 1121546 7 WARATAH GROVE 温杜里 3355

请注意,Property No: 1121546 是纯文本,7 WARATAH GROVE & WENDOUREE 3355粗体

任何帮助将不胜感激。

提前致谢, 西

文本提取 pdftotext

评论

0赞 Kanjeero boocho 10/18/2023
我不明白。如果您有代码,请分享

答: 暂无答案