复杂的嵌套 json 结构,所有内容仅表示一行,数组中的重复元素需要在同一行中展平

Complex nested json structure which all contents represent just one row with repeated elements in arrays required to be flatten in the same exact row

提问人:Filomeno Gonzalez 提问时间:11/17/2023 更新时间:11/17/2023 访问量:20

问:

我有一个复杂的嵌套 json 结构文件,其中 100% 的元素(数组和结构)必须展平为相同的行。因此,每个 json 文件都是一行。10 个 Json 文件 = 10 行。下面是 json 文件的示例:JSON file example

我多么希望我能扁平化文件,删除数组中每个键的重复值:enter image description here

这可以通过 spark 中的 .getItem() 来实现,但有没有动态方法?

我尝试了爆炸,但是爆炸为数组中的每个元素创建了新行,我需要它们在同一行中。如果我透视,我需要对一些列进行分组,这是不可接受的。谢谢。

数组 json pyspark flatten json-flattener

评论

0赞 Nick 11/17/2023
请阅读提问时为什么不在 SO 上上传代码图像,并编辑您的问题以文本形式包含代码数据,而不是图像。

答: 暂无答案