Pentaho 文本文件输入有 2 行 1 行

Pentaho Text File Input Have 2 Line in 1 Row

提问人:Alfian Irdandi 提问时间:7/27/2023 最后编辑:Alfian Irdandi 更新时间:7/27/2023 访问量:60

问:

所以我有这样的文本文件:

Code   Prod_Name    Color   Stock        Price
201    Long         Lime    50           3900
       Shirt        Green
202    Short Skull  Dark    100          3900
       Shirt        Red 

我想这样读:

Code   Prod_Name          Color         Stock        Price
201    Long Shirt         Lime Green    50           3900
202    Short Skull Shirt  Dark Red      100          3900

那么,如何在Pentaho中实现这一目标呢?

我尝试过使用换行进行文本输入,但这似乎不是解决方案。

数据库 输入 文本 pentaho pentaho-data-integration

评论


答:

0赞 Bert-Jan Stroop 7/27/2023 #1

棘手的。不要以为有一个标准的步骤来实现这一点。这是一个非常罕见的情况imo。但你可以做到......只需加载文件,并在加载过程中添加行号。然后用过滤器从不均匀中分离。在偶数侧执行 rownumber-1,并在行号上将两组连接在一起。然后连接新集中每个字段的两个版本。(不要忘记修剪字段,以防一列没有 2 行,并且无缘无故添加分隔符空间)

Sollution

更好的做法是在插入中重复 ID 号(在本例中为“代码”),然后在此字段上进行连接:

Alternative

结果:

Result_image

评论

0赞 Alfian Irdandi 7/28/2023
凉!这是工作,它将帮助我解决另一个数据案例,谢谢