PySpark Tabula-Py Read_PDF(错误:没有名为“org.apache.commons”的模块)
作者:mohamadmaarouf_ 提问时间:9/11/2023
我已经在 Azure 中运行管道 4 个月了,昨晚它突然坏了。我有以下代码: !pip install tabula-py from tabula.io import read_pdf import...
tabula-py 问答列表
作者:mohamadmaarouf_ 提问时间:9/11/2023
我已经在 Azure 中运行管道 4 个月了,昨晚它突然坏了。我有以下代码: !pip install tabula-py from tabula.io import read_pdf import...
作者:mayk.dyasper 提问时间:3/10/2023
我有一个解析pdf文件的脚本。 在我的 WSL 上,它运行良好,但是当我在 Centos 7 上部署它时,我遇到了这个错误。 我正在使用 tabula-py python 版本:3.6 Java ...
作者:Vihanga Dewathsara Mohottige 提问时间:9/20/2023
我正在尝试从包含多个表格的 pdf 中读取数据。有 5 个包含数据的表和一个空表。除空表外,其中 3 个是垂直表,2 个是水平表。所有垂直表的数据都是正确的,但是当 tabula 尝试读取水平表时,它...
作者:mohamadmaarouf_ 提问时间:9/11/2023
我已经在 Azure 中运行管道 4 个月了,昨晚它突然坏了。我有以下代码: !pip install tabula-py from tabula.io import read_pdf import...
作者:Luiz Maleico 提问时间:11/14/2023
我正在用 Python 编写一个脚本来读取 PDF 并将 dataFrame 转换为带有 tabula 的 CSV,我尝试了两种方法,convert_into 和 read_pdf,它们返回我调用的所...