PySpark Tabula-Py Read_PDF(错误:没有名为“org.apache.commons”的模块)
作者:mohamadmaarouf_ 提问时间:9/11/2023
我已经在 Azure 中运行管道 4 个月了,昨晚它突然坏了。我有以下代码: !pip install tabula-py from tabula.io import read_pdf import...
tabula 问答列表
作者:mohamadmaarouf_ 提问时间:9/11/2023
我已经在 Azure 中运行管道 4 个月了,昨晚它突然坏了。我有以下代码: !pip install tabula-py from tabula.io import read_pdf import...
作者:mayk.dyasper 提问时间:3/10/2023
我有一个解析pdf文件的脚本。 在我的 WSL 上,它运行良好,但是当我在 Centos 7 上部署它时,我遇到了这个错误。 我正在使用 tabula-py python 版本:3.6 Java ...
作者:Fellipe Zambrano 提问时间:9/10/2023
我需要从 PDF 文件中获取表格。 代码是: pdf=tabula.read_pdf(arquivo, pages=(1,2), lattice=True) 我将两个 df 转换为列表,如下所示...
作者:Vihanga Dewathsara Mohottige 提问时间:9/20/2023
我正在尝试从包含多个表格的 pdf 中读取数据。有 5 个包含数据的表和一个空表。除空表外,其中 3 个是垂直表,2 个是水平表。所有垂直表的数据都是正确的,但是当 tabula 尝试读取水平表时,它...
作者:mohamadmaarouf_ 提问时间:9/11/2023
我已经在 Azure 中运行管道 4 个月了,昨晚它突然坏了。我有以下代码: !pip install tabula-py from tabula.io import read_pdf import...
作者:Mr.Child 提问时间:10/6/2023
我正在 Jupyter Notebook 上运行tabula.read_pdf函数。它一直告诉我死了内核。有什么想法可以解决这个问题吗?非常感谢! 我尝试在 jupyter 笔记本上安装该包,并在 ...
作者:Mikołaj Sobczak 提问时间:10/29/2023
我正在编写一个程序。用户可以上传PDF文件。每个文件都有一个表。每个表都有列,例如(产品名称、单位、价格),有些文件可能不止这三列。我需要将每个pdf文件的三列数据保存到我的数据库中。 我的问题是我不...
作者:Vickar 提问时间:11/8/2023
我正在使用包含 CTE 的本机查询在 SSAS 中创建表。当我在 IMPORT 模式下将 CTE 用于 SSAS 模型时,它运行良好。但是,当我在 DIRECT QUERY 模式下在 SSAS 模型中...
作者:Luiz Maleico 提问时间:11/14/2023
我正在用 Python 编写一个脚本来读取 PDF 并将 dataFrame 转换为带有 tabula 的 CSV,我尝试了两种方法,convert_into 和 read_pdf,它们返回我调用的所...
作者:sachin itape 提问时间:11/17/2023
我在一台服务器上有一个 SSAS 表格模型,并希望同时将该模型同步到多台服务器,这是否会对速度或性能产生任何影响。 目前,表格模型一次同步一个,但我想同时同步到两个服务器的相同模型。...