apache-spark 问答列表

Spark sql 相关子查询组 by

作者:Andrea Campolonghi 提问时间:11/17/2023

Spark SQL 版本 3.3。 以下查询: select d.from_id, d.to_id, d.hts_code, min(d.transaction_date) as earl...

将一些日志从 kafka 主题获取到 spark 中,并将其发送到 elasticsearch

作者:Ilyas Ch 提问时间:11/17/2023

我正在尝试通过apache spark将一些数据从apache kafka发送到elasticsearch,现在我正在测试管道,但仍然遇到一些错误,最终我将构建一个机器学习模型来对spark中的传入数...

在 Kubernetes 上运行 Spark 教程 [已关闭]

作者:Nguyễn Quốc Nhật Minh 提问时间:11/17/2023

已关闭。这个问题需要更加集中。它目前不接受答案。 想改进这个问题吗?更新问题,使其仅通过编辑这篇文章来关注一个问题。 2天前关闭。 改进此问题 我正在学习在 k8s (minikube) 上创...

如何执行 T-SQL 操作 UPDATE ...设置。。。在 Pyspark 中?

作者:ByUnal 提问时间:11/16/2023

我有需要在pyspark中编码的T-SQL查询。但是,Pyspark 并不支持所有 SQL 操作,因此您必须相应地构建自己的逻辑。我已经设法转换了许多查询,但我无法确定如何在Pyspark中执行此操作...

连接 API,使用 pyspark 解析结果并将其存储在 neo4j 中

作者:Sathyamoorthy 提问时间:11/16/2023

我的要求是直截了当的。我有一个 API 调用,它检索了大量数据。我想使用 PySpark 将它们转换为 DataFrame 并写入 Neo4J。 将 API 结果转换为 Dataframes 并将其...

Spark :为什么它不起作用并给我 Py4JJavaError,但是当我添加查找 spark 时它有效?

作者:Dan Albert 提问时间:11/17/2023

我有这个代码 from pyspark.sql import SparkSession # Create a Spark session spark = SparkSession.builder...

将数据更新插入到 Snowflake 中?

作者:Pepria 提问时间:11/17/2023

我有一个用例,我需要以编程方式将数据从一个或多个 JSON 文件复制到 Snowflake 表中。但是,当我复制文件时,我还需要对记录进行更新插入。例如,如果我从以下 JSON 开始: [ { ...

对布尔值进行过滤时出现奇怪的 pyspark 行为

作者:rouble 提问时间:11/17/2023

我们有一些现有的代码曾经在 Spark 3.1 中工作,现在在 Spark 3.3 中不起作用。这真的是微不足道的代码,所以它让我大吃一惊为什么过滤器不起作用: widgets_df = widge...

将数据从 apache kafka 流式传输到 apache spark,然后流式传输到 ubuntu 中的 elasticsearch

作者:Ilyas Ch 提问时间:11/16/2023

我想用python脚本通过apache spark从apache kafka主题中读取数据,然后对数据进行一些操作,然后实时流式传输到elasticsearch;最终,我将构建一个模型来对数据执行,并...

Databricks SQL 错误 (UNSUPPORTED_SUBQUERY_EXPRESSION_CATEGORY。ACCESSING_OUTER_QUERY_COLUMN_IS_NOT_ALLOWED) 使用 SQL UDF 的

作者:Trevor C 提问时间:11/17/2023

我有一个大型工作 SQL 查询,我在 Databricks 工作区中将其参数化并注册为 SQL UDF。大型查询的部分内容在其他地方重复出现,因此,我想将其分成两个 SQL UDF:一个 covera...


共80条 当前第4页