Tabula-py 无法正确读取水平表

Tabula-py does not read horizontal tables correctly

提问人:Vihanga Dewathsara Mohottige 提问时间:9/20/2023 最后编辑:Vihanga Dewathsara Mohottige 更新时间:9/21/2023 访问量:42

问:

enter image description here我正在尝试从包含多个表格的 pdf 中读取数据。有 5 个包含数据的表和一个空表。除空表外,其中 3 个是垂直表,2 个是水平表。所有垂直表的数据都是正确的,但是当 tabula 尝试读取水平表时,它仍然读取为垂直表。enter image description here我该如何解决这个问题?

我阅读了文档表格,但我找不到任何与水平表格阅读相关的内容

python list tabular tabula tabula-py

评论

1赞 Tim Roberts 9/20/2023
我不知道如果所有数据都消失了,你为什么还要发布这张照片。PDF 不是为这样阅读而设计的。它正在尽其所能。当然,如果数据不存在,您可以找到一种方法来处理您拥有的数据。
0赞 Vihanga Dewathsara Mohottige 9/20/2023
数据仍然存在。当我发布该pdf时,由于隐私问题,我必须将其隐藏起来。
0赞 Tim Roberts 9/20/2023
对不起,我的意思是,只要你有数据,就很容易重新格式化它。
0赞 Vihanga Dewathsara Mohottige 9/21/2023
对不起,我忘了突出显示我显示的表格。现在您可以在 PDF 中看到表格(用红线框住)以及我尝试从 Tabula 中阅读时的结果。
0赞 Tim Roberts 9/21/2023
是的,我明白了这一切。你拥有你想要的所有数据。如果它没有按照您想要的方式格式化,那么您需要重新格式化它。就这么简单。

答: 暂无答案