Python pandas.read_csv() 引号和分隔符在一行中,不带 escapechar

Python pandas.read_csv() quotes and separator in one line without escapechar

提问人:Ga11eaN 提问时间:11/4/2022 最后编辑:MagnusO_OGa11eaN 更新时间:11/4/2022 访问量:60

问:

我有csv文件,其中引号和分隔符(逗号)可以在引号内,如下所示:

Id,Name,Other
1,"Matt"hew","a,bc"

我知道,在 csv 文件中使用 escaprechar 很容易,但实际工作文件是 50 000 行和近 100 列,无法手动完成。

如果我使用:

 pandas.read_csv(filename, delimiter=',', quoting=3)

我收到以下输出:

1|"Matt"hew"|"a

如果我使用另一个引号 (0, 1, 2),我会收到:

1|Matthew"|a,bc

但我需要这样的输出:

1|Matt"hew|a,bc
Python 熊猫 报价 分隔符

评论

0赞 Tim Roberts 11/4/2022
这不是有效的 CSV 文件。修复无效文件从来没有一般规则。您可能需要编写一个单独的脚本,以使用可接受的方法之一(如 或 )来修复引号。"Matt""hew""Matt\"hew"
0赞 Ga11eaN 11/4/2022
我使用以下方法解决了这个问题:我从原始文件中查看了临时文件,该文件在任何引号之前添加了 escapechar=“\”,它不在逗号附近,并且运行良好

答: 暂无答案