tabula 问答列表

PySpark Tabula-Py Read_PDF(错误:没有名为“org.apache.commons”的模块)

作者:mohamadmaarouf_ 提问时间:9/11/2023

我已经在 Azure 中运行管道 4 个月了,昨晚它突然坏了。我有以下代码: !pip install tabula-py from tabula.io import read_pdf import...

来自 tabula-java 的错误:错误:错误:标头不包含 versioninfo

作者:mayk.dyasper 提问时间:3/10/2023

我有一个解析pdf文件的脚本。 在我的 WSL 上,它运行良好,但是当我在 Centos 7 上部署它时,我遇到了这个错误。 我正在使用 tabula-py python 版本:3.6 Java ...

Tabula pd df 损失数据

作者:Fellipe Zambrano 提问时间:9/10/2023

我需要从 PDF 文件中获取表格。 代码是: pdf=tabula.read_pdf(arquivo, pages=(1,2), lattice=True) 我将两个 df 转换为列表,如下所示...

Tabula-py 无法正确读取水平表

作者:Vihanga Dewathsara Mohottige 提问时间:9/20/2023

我正在尝试从包含多个表格的 pdf 中读取数据。有 5 个包含数据的表和一个空表。除空表外,其中 3 个是垂直表,2 个是水平表。所有垂直表的数据都是正确的,但是当 tabula 尝试读取水平表时,它...

PySpark Tabula-Py Read_PDF(错误:没有名为“org.apache.commons”的模块)

作者:mohamadmaarouf_ 提问时间:9/11/2023

我已经在 Azure 中运行管道 4 个月了,昨晚它突然坏了。我有以下代码: !pip install tabula-py from tabula.io import read_pdf import...

运行 tabula 时内核死亡

作者:Mr.Child 提问时间:10/6/2023

我正在 Jupyter Notebook 上运行tabula.read_pdf函数。它一直告诉我死了内核。有什么想法可以解决这个问题吗?非常感谢! 我尝试在 jupyter 笔记本上安装该包,并在 ...

仅提取表的某些列的最佳方法是什么

作者:Mikołaj Sobczak 提问时间:10/29/2023

我正在编写一个程序。用户可以上传PDF文件。每个文件都有一个表。每个表都有列,例如(产品名称、单位、价格),有些文件可能不止这三列。我需要将每个pdf文件的三列数据保存到我的数据库中。 我的问题是我不...

CTE 在 SSAS 导入模式下工作,但在 SSAS 直接查询模式下不工作

作者:Vickar 提问时间:11/8/2023

我正在使用包含 CTE 的本机查询在 SSAS 中创建表。当我在 IMPORT 模式下将 CTE 用于 SSAS 模型时,它运行良好。但是,当我在 DIRECT QUERY 模式下在 SSAS 模型中...

Tabula 将文本分解为未命名的列

作者:Luiz Maleico 提问时间:11/14/2023

我正在用 Python 编写一个脚本来读取 PDF 并将 dataFrame 转换为带有 tabula 的 CSV,我尝试了两种方法,convert_into 和 read_pdf,它们返回我调用的所...

同时将表格模型从单个服务器同步到两个不同的服务器

作者:sachin itape 提问时间:11/17/2023

我在一台服务器上有一个 SSAS 表格模型,并希望同时将该模型同步到多台服务器,这是否会对速度或性能产生任何影响。 目前,表格模型一次同步一个,但我想同时同步到两个服务器的相同模型。...


共10条 当前第1页