提问人:Antonio 提问时间:10/24/2023 更新时间:10/24/2023 访问量:49
如何将pyPDF2的输出保存到Excel文件中?
How to save output of pyPDF2 into an Excel file?
问:
以下代码打印我需要它的内容(格式不理想,但如果我能找到如何另存为 excel 文件,这可能无关紧要)。
for i in range(3,167):
print(reader.pages[i].extract_text().split('\n'))
我尝试使用 Pandas 来保存输出:
for i in range(3,167):
(reader.pages[i].extract_text().split('\n')).to_excel('output.xlsx', index = False)
我不精通 Python。如果有更好的方法,请告诉我。我不太懂得如何很好地使用柯莱特。
答:
0赞
Anna Andreeva Rogotulka
10/24/2023
#1
尝试从 PDF 中解析您需要的内容,然后保存 DataFrame
import pandas as pd
#store the data
data = []
for i in range(3, 167):
text = reader.pages[i].extract_text()
lines = text.split('\n')
data.extend(lines)
# DataFrame from the list
df = pd.DataFrame(data, columns=['Text'])
# Save it to an Excel file
df.to_excel('output.xlsx', index=False)
评论