如何解析下面的行，以便它将第三列作为 Python 中的列表-解网

问：

如何使用 pandas 或 CSV 类型模块解析此行

col1, col2, col3 <br>
name, date, ["data"] <br>
name, date, ["data", "data2", "data3"]  <br>
name, date, ["data1", "data2"] <br>

这是文件的格式。

如果我使用

pd.read_csv(file)

我收到此错误

pandas.errors.ParserError: Error tokenizing data. C error: Expected 3 fields in line 3, saw 5

Python Pandas CSV 解析

import pandas as pd
from io import StringIO
import ast

# Your data 
data = ...

# Coverting data into string representation
data_file = StringIO(data)

# Converter function to convert the string representation of lists to actual lists
def parse_list(s):
    return ast.literal_eval(s)

df = pd.read_csv(data_file, converters={'col3': parse_list})
print(df)

# To remove <br> tags from each line
df.rename(columns={'col3 <br>':'col3'}, inplace=True)
df['col3'] = df['col3'].apply(lambda x : x.replace(' <br>', '').strip())

>>> output
   col1  col2                        col3
0  name  date                    ["data"]
1  name  date  ["data", "data2", "data3"]
2  name  date          ["data1", "data2"]

0赞 PaulS 7/22/2023 #3

另一个可能的解决方案：

from io import StringIO

df = pd.read_csv(StringIO(text), sep=r', (?!\")|\s+\<br\>',
             engine='python').dropna(axis=1)

输出：

   col1  col2                        col3
0  name  date                    ["data"]
1  name  date  ["data", "data2", "data3"]
2  name  date          ["data1", "data2"]

上一个：如何通过筛选标题来处理 .csv 文件

下一个：Angular 16 - 将 PapaParse ngx 的结果传递给 API 提交

如何解析下面的行，以便它将第三列作为 Python 中的列表

how to parse line below so that it will preseve the third column as a list in python

评论

评论