使用条件将 Excel 文件导入 Panda (Python)

Importing Excel file into Panda (Python) using conditions

提问人:Cliff 提问时间:5/16/2023 最后编辑:AKXCliff 更新时间:5/16/2023 访问量:57

问:

我正在使用 Python 2.7.18.4(我知道一个旧版本,但我无法更改)导入一组(可能大约 1000 个,也许更多)Excel 文件。每个 Excel 文件都包含我感兴趣的相同列,但每次编写方式都不同。我的想法如下:使用Python和Pandas,我想导入一个Excel文件,然后检查我需要的内容是否有用。我需要的内容如下所示:

项目 地块编号 系列
0 72GW99752 3 波克杜斯
1 72GW99753 548 PDGCHG公司
0 编号:233AWW997T52 35 SYDIUM(西迪姆酒店)
... ... ... ...
没有 235 没有

这张表之前和之后也是内容,但我对此不感兴趣,所以我想跳过它。我想使用从直到的所有内容(因为在某种程度上是对先前值的回顾/控制,但如果需要,我们也可以跳过这个值)。我在以下线程中读到,使用 Pandas 并遍历数据帧然后复制重要的内容并不“明智”,因为 Pandas 用于大规模使用。 但是,我对这个答案很感兴趣:ItemTotalTotal

df_new = df.loc[df.loc[df.ID == "-", 'ID'].index.values]

是否可以“滥用”验证部分以检查我的内容是否在行和行之间?ItemTotal

Python 熊猫 数据帧 python-2.7

评论

1赞 AKX 5/16/2023
只需使用(假设它与 Python 2.7 兼容)来读取 Excel 文件 - 您不需要数据帧。openpyxl
0赞 Cliff 5/16/2023
像我需要的“验证”甚至可以在 openpyxl 中创建吗?
0赞 AKX 5/17/2023
Openpyxl 只解析 Excel 文件;您可以像迭代任何数据一样遍历这些行。

答: 暂无答案