将 pyspark 翻译成 sql-解网

问：

我遇到以下功能的问题。我正在尝试将其转换为 SQL 语句，以便我可以更好地了解到底发生了什么，这样我就可以更有效地处理我的实际问题。

我知道它包含valid_data到ri_data之间的连接、过滤器和 select 语句。我主要是在理解如何编写连接文章方面遇到问题。

        result = (
            valid_data.join(
                ri_data,
                F.col(table_name + "." + column_name) == ri_data.ri_column,
                "left_outer",
            )
            .filter(f"ri_column IS NULL")
            .selectExpr(
                "etl_row_id AS row_id", f"{table_name}.{column_name} AS error_value"
            )
            .distinct()

任何帮助都是值得赞赏的。

SQL pyspark

将 pyspark 翻译成 sql

Translating pyspark into sql

评论