问答列表

Tabula 不提取 pdf 中的每一行数据

作者:Mark k 提问时间:9/19/2023

我目前有一个问题,我有点挣扎。我正在尝试使用表格库从 pdf 中提取每一行。我遇到的问题是,通常脚本可以正确提取数据,但由于某种原因,它没有提取每一行: Number of pages read: ...

_nanquantile_dispatcher() 有一个意外的关键字参数“method”

作者:Luis Valencia 提问时间:9/19/2023

我有一个大约有 6k 行的 pandaas 数据帧,有一个每小时的时间戳列和一个浮点数的值。 我正在使用 DARTS 进行预测和绘图 import pandas as pd from darts ...

如何创建一个新列,其中的值是根据现有列选择的?

作者:user7289 提问时间:11/12/2013

如何将列添加到以下数据帧中,以便 if 和 else?colorcolor='green'Set == 'Z'color='red' Type Set 1 A Z 2 B Z 3 B X 4 C...

dask.read_csv比 50k 列的 pandas.read_csv 慢得多

作者:Daniel Pinyol 提问时间:10/5/2023

我有一个包含 1k 行和 50k 列的 csv。 我花了 9 秒来计算所有带有 pandas 的列的最小值 panda_df = pd.read_csv(path, sep=",") # 8s m...

修复使用 Tabula 读取 PDF 文件中的表格时缺少的标题

作者:khankhattak 提问时间:10/2/2023

我想从PDF文件中1992年至1993年的统计进出口数据下面的PDF文件图像中提取表格数据 我想要的数据是创建数据集的数值数据。我尝试使用 tabula.py 库,但我获得的数据不可用或不可纠正:T...

消除日期时间格式的小数

作者:BENJAMÍN IBÁÑEZ 提问时间:10/7/2023

我有一个这种格式类型,但数据框中的一些数据具有这种格式类型。如何删除第二种格式类型,以便所有内容都保持第一种格式类型?DataFrame2018-08-13 00:03:502018-08-13 06...

Pandas:将两列中的 null 值添加到 null

作者:Kumar Arunachal 提问时间:10/8/2023

我有一张如下表。 一个 B C 1.0 1.5 基线 南 南 基线 2.0 南 基线 我想在对前两列求和后插入一列,并希望得到如下所示的结果。 一个 B 和 C 1.0 1.5 2.5 基线 南...

python中多个变量和组的显著性的n因子方差分析检验

作者:ApaarBawa 提问时间:10/11/2023

我有一个包含列的数据框:“category”、“count”和“phase”。示例数据如下所示: 类别 计数 阶段 国际政治 4221 阶段0 经济 6182 第1阶段 国内事务 1151 阶段0 ...

使用 Pandas 对同一工作簿的多个工作表进行pd.read_excel()

作者:HaPsantran 提问时间:10/23/2014

我有一个大型电子表格文件(.xlsx),我正在使用 python pandas 进行处理。碰巧我需要来自该大文件中的两个选项卡(工作表)的数据。其中一个选项卡有大量数据,另一个只是几个方形单元格。 ...

如何更改使用 Matplotlib 绘制的图形的大小?

作者:tatwright 提问时间:12/2/2008

如何更改使用 Matplotlib 绘制的图形的大小?...


共274条 当前第18页