白板 问答列表

Tabula 不提取 pdf 中的每一行数据

作者:Mark k 提问时间:9/19/2023

我目前有一个问题,我有点挣扎。我正在尝试使用表格库从 pdf 中提取每一行。我遇到的问题是,通常脚本可以正确提取数据,但由于某种原因,它没有提取每一行: Number of pages read: ...

修复使用 Tabula 读取 PDF 文件中的表格时缺少的标题

作者:khankhattak 提问时间:10/2/2023

我想从PDF文件中1992年至1993年的统计进出口数据下面的PDF文件图像中提取表格数据 我想要的数据是创建数据集的数值数据。我尝试使用 tabula.py 库,但我获得的数据不可用或不可纠正:T...

使用表格从 PDF 中抓取表格。获取随机编码输出

作者:Gallo1999 提问时间:11/10/2023

这是我的代码,它已经在抓取我想要的区域,但部分输出似乎已被编码。我尝试更改为不同的,例如encoding='Latin1'等,但没有运气。想看看是否有人有任何建议。 import tabula p...

Tabula 未读取我的 pdf/all 数据为空白

作者:Analyst4 提问时间:11/18/2023

我正在尝试获取此 pdf:https://www.occ.gov/topics/charters-and-licensing/weekly-bulletin/2023/wb-11052023-1111...


共4条 当前第1页