变音符号 (ä, ö, ü) 德语字符替换为 ?在 Pentaho ETL 工具中

umlaut (ä, ö, ü) german character replacing with ? in Pentaho ETL tool

提问人:Krishna Murthy 提问时间:10/3/2023 更新时间:10/4/2023 访问量:48

问:

我们正在使用 pentaho ETL 工具将数据从 CSV 文件处理到数据库 (DB2)。 在文件中,我们有变音符号 (ä, ö, ü) 德语字符,同时将数据从 CSV 加载到 DB2 , 变音符号 (ä, ö, ü) chatactes 替换为 ?(问号)。

我们不确定为什么变音符号会变成?,你能帮忙吗?

ETL 工具:Pentaho (3.0.4) 数据库 : DB2

提前致谢, 奎 师 那。

我们已经检查了数据库级别,我们不确定如何在 Pentaho ETL 工具中检查变音字符行为的过程,

需要知道 Petaho 工具如何处理 Umlaut 聊天者以及我们需要更改的地方。

数据库 DB2 ETL Pentaho

评论

2赞 NickW 10/3/2023
这可能是由于在管道的不同点配置了不同的代码页(即您的 csv 文件使用类似 UTF-8 的东西,但 Pentaho 和/或 DB2 使用类似 Latin1 的东西)
0赞 nfgl 10/3/2023
检查 CSV 文件输入步骤,并查看如何使用“预览”处理此值,如果字符不正确,请尝试使用其他值进行文件编码。否则,请说明 DB2 运行在哪个平台上。

答:

1赞 Rishu S 10/4/2023 #1

在 Pentaho 中,CSV 文件输入步骤可以选择设置文件的编码。您可以将其设置为 UTF-8(默认)或 UTF-16 以启用读取特殊字符(如德语变音符号)。似乎没有使用正确的编码创建 DB2 数据库。可能使用正确的编码重新创建 DB2 数据库会有所帮助。

此外,如果您使用的是 Pentaho 3.0.4 版,我强烈建议您升级到 9.x.x 版,因为 Hitachi / Pentaho 不支持 8.x.x 之前的任何版本。

enter image description here

使用 Pentaho 加载德语变音词的示例

enter image description here

评论

0赞 Bert-Jan Stroop 11/13/2023
同意,可能想要像 Notepad++ 这样的东西来确定字符集(或者至少做出有根据的猜测)