DuckDB:查询包含换行符值的 csv

DuckDB: querying csvs containing values with newlines

提问人:user3896248 提问时间:10/25/2023 最后编辑:Gabor Szarnyasuser3896248 更新时间:11/2/2023 访问量:39

问:

根据 csv 规范,包含换行符的值应用双引号括起来。电子表格程序通常可以很好地处理此问题,将带引号值的换行符视为单个单元格。

不幸的是,我还没有设法在 DuckDb 中实现相同的目标。如果我尝试使用 read_csv_auto 进行选择,则在使用换行符扫描值时,DuckDb 将以未终止的双引号为由引发错误。

我可以手动转义换行符,例如 \\n,但这仍然会在查询输出中解析为 \\n,因此我还需要手动取消转义字符串类型的字段,这很快就会变得难以维护。我可以更改换行符,但由于唯一的选项是 \n、\r 和 \r\n,这只会真正解决问题。

这里有一个好的解决方案可以在不引发错误的情况下取回我插入的相同换行符吗?

鸭子数据库

评论

0赞 keraion 10/26/2023
您能否提供一些产生此错误的示例记录?

答: 暂无答案