Databricks 问答列表

是否有 SQL 窗口函数可以使用上一行的计算值?

作者:Paul Samsotha 提问时间:11/14/2023

我需要根据上一行的计算值来计算一行的值。我正在寻找一些窗口函数(或其他解决方案),如果有的话,可以帮助我做到这一点。对于上下文,我们有以下数据: CREATE OR REPLACE TABLE ex...

where 语句中前六个月的 Databricks SQL 语法

作者:Samantha Clark 提问时间:2/18/2023

我试图弄清楚如何在 Databricks 中 SQL 查询的 where 语句中查找过去六个月的数据,但我在语法方面遇到很多问题。 现在我有: Select * from table where ...

如何从 Azure Databricks 输出“基础 SQLException”而不是一般异常消息?

作者:LearneR 提问时间:11/16/2023

我们从数据工厂管道调用 Azure Databricks 笔记本,该管道将引入到 Azure Synapse 中。但是,每当笔记本运行失败时,它只会显示以下错误消息: com.databricks....

Databricks SQL 错误 (UNSUPPORTED_SUBQUERY_EXPRESSION_CATEGORY。ACCESSING_OUTER_QUERY_COLUMN_IS_NOT_ALLOWED) 使用 SQL UDF 的

作者:Trevor C 提问时间:11/17/2023

我有一个大型工作 SQL 查询,我在 Databricks 工作区中将其参数化并注册为 SQL UDF。大型查询的部分内容在其他地方重复出现,因此,我想将其分成两个 SQL UDF:一个 covera...

使用增量实时表时本地卷文件的正确路径

作者:Shawn Eary 提问时间:11/16/2023

我将以下文件放在名为 livelandingtest 的本地 Databricks 卷中: /Volumes/seary_test/default/livelandingtest/TIOBE/TIOB...

具有分区文件夹的 Datalake 中的 Databricks 增量表

作者:LordRofticus 提问时间:11/16/2023

我在名为“暂存”的容器中有有关 Azure 存储帐户的数据。 使用 SourceSystem/Dataset 层次结构,我每月还有基于日期的文件夹。在文件夹内,数据以增量格式存储。 在数据块中,我...

通过在 Unity 目录之上创建的 Delta 共享读取多个架构,该共享以流式处理方式涉及 400+ 并发更新

作者:Newbie 提问时间:11/16/2023

如何通过涉及 400+ 并发更新的增量共享以流式处理方式读取多个架构。 DLT 似乎对管道上的 100 个并发更新有限制。最初,我想在单个管道中创建多个独立的流。kafka 还是 Kinesis 更...

UserWarning:createDataFrame 尝试在 pyspark createDataFrame 中进行箭头优化

作者:RunTheGauntlet 提问时间:11/16/2023

在具有运行时 12.2 LTS ML(包括 Apache Spark 3.3.2、Scala 2.12)的 Azure DataBricks 中,我正在尝试运行以下脚本: import pandas...

按顺序从数组列中获取非重复行 pyspark

作者:mouli lee 提问时间:11/16/2023

我有一个包含 2 列的 pyspark 数据帧。Column1 是整数列,Column2 是 ArrayType。我需要获取一个数据帧,该 Column2 的前几行中没有任何重复元素。在 Column...

Databricks Autoloader 重新激活全 null 列

作者:Mehdi Jafari 提问时间:11/15/2023

我们正在使用 Azure Functions 将一些 txt 文件模拟到 parquet。然后,Databricks Autoloader 读取 parquet 文件。为了让 Autoloader 将...


共54条 当前第1页