是否有 SQL 窗口函数可以使用上一行的计算值?
作者:Paul Samsotha 提问时间:11/14/2023
我需要根据上一行的计算值来计算一行的值。我正在寻找一些窗口函数(或其他解决方案),如果有的话,可以帮助我做到这一点。对于上下文,我们有以下数据: CREATE OR REPLACE TABLE ex...
Databricks 问答列表
作者:Paul Samsotha 提问时间:11/14/2023
我需要根据上一行的计算值来计算一行的值。我正在寻找一些窗口函数(或其他解决方案),如果有的话,可以帮助我做到这一点。对于上下文,我们有以下数据: CREATE OR REPLACE TABLE ex...
作者:Samantha Clark 提问时间:2/18/2023
我试图弄清楚如何在 Databricks 中 SQL 查询的 where 语句中查找过去六个月的数据,但我在语法方面遇到很多问题。 现在我有: Select * from table where ...
作者:LearneR 提问时间:11/16/2023
我们从数据工厂管道调用 Azure Databricks 笔记本,该管道将引入到 Azure Synapse 中。但是,每当笔记本运行失败时,它只会显示以下错误消息: com.databricks....
作者:Trevor C 提问时间:11/17/2023
我有一个大型工作 SQL 查询,我在 Databricks 工作区中将其参数化并注册为 SQL UDF。大型查询的部分内容在其他地方重复出现,因此,我想将其分成两个 SQL UDF:一个 covera...
作者:Shawn Eary 提问时间:11/16/2023
我将以下文件放在名为 livelandingtest 的本地 Databricks 卷中: /Volumes/seary_test/default/livelandingtest/TIOBE/TIOB...
作者:LordRofticus 提问时间:11/16/2023
我在名为“暂存”的容器中有有关 Azure 存储帐户的数据。 使用 SourceSystem/Dataset 层次结构,我每月还有基于日期的文件夹。在文件夹内,数据以增量格式存储。 在数据块中,我...
作者:Newbie 提问时间:11/16/2023
如何通过涉及 400+ 并发更新的增量共享以流式处理方式读取多个架构。 DLT 似乎对管道上的 100 个并发更新有限制。最初,我想在单个管道中创建多个独立的流。kafka 还是 Kinesis 更...
作者:RunTheGauntlet 提问时间:11/16/2023
在具有运行时 12.2 LTS ML(包括 Apache Spark 3.3.2、Scala 2.12)的 Azure DataBricks 中,我正在尝试运行以下脚本: import pandas...
作者:mouli lee 提问时间:11/16/2023
我有一个包含 2 列的 pyspark 数据帧。Column1 是整数列,Column2 是 ArrayType。我需要获取一个数据帧,该 Column2 的前几行中没有任何重复元素。在 Column...
作者:Mehdi Jafari 提问时间:11/15/2023
我们正在使用 Azure Functions 将一些 txt 文件模拟到 parquet。然后,Databricks Autoloader 读取 parquet 文件。为了让 Autoloader 将...