不断获取 ParseError

Keep getting ParseError

提问人:Ryan 提问时间:4/16/2023 最后编辑:Ajeet VermaRyan 更新时间:4/18/2023 访问量:36

问:

我正在尝试阅读这个txt文件。但是由于某些原因,我一直收到此错误:

ParserError:标记数据时出错。C 错误:第 27 行中预期有 1 个字段,看到 367

以下是我的代码:

df = pd.read_csv('githublink')  
df.read()

来自 githublink 的数据:

pandas 解析错误

评论

0赞 John Gordon 4/16/2023
如果您使用的是与您发布的相同的 github 链接,那就是问题所在。该页面包含大量 html,这让 csv 解析器感到困惑。
0赞 Community 4/25/2023
请澄清您的具体问题或提供其他详细信息以准确说明您的需求。正如目前所写的那样,很难确切地说出你在问什么。

答:

0赞 Rukon 4/16/2023 #1

您必须使用 GitHub 中的链接,因为您提供的链接会返回一个页面。RawHTML

import pandas as pd
import io
import requests
url="https://raw.githubusercontent.com/ryan-2121/data/595128c71d558943d0fbc518dcca618a7273d058/product_care"  # using the raw link from github
s=requests.get(url).content
df = pd.read_csv(io.StringIO(s.decode()), sep=",", header=None, names = ['Region','Market','Chart',"Name","Unit","Source","2014","2015","2016","2017",'2018',"2019","2020","2021","2022",'2023',"2024","2025","2026","2027"] )
df.drop(index=df.index[0], axis=0, inplace=True) # The first row contains the column name, hence dropping it.