databricks 问答列表

如何从列表创建接触点表

作者:Wagner André Yamada Vieira 提问时间:1/9/2023

我正在 Azure Databricks 环境中处理具有以下数据集的 SQL 查询: CREATE OR REPLACE TABLE touchpoints_table ( List STRING...

在接触点表创建 (SQL) 中按问题分组

作者:Wagner André Yamada Vieira 提问时间:1/9/2023

我正在 Azure Databricks 环境中处理具有以下数据集的 SQL 查询: CREATE OR REPLACE TABLE touchpoints_table ( List STRING...

安装 dbx 时出错 - pip install dbx - pipenv 错误 cffi

作者:Nankin 提问时间:2/4/2023

我正在尝试使用以下说明设置与 Databricks 的 Visual Studio Code 连接:https://docs.databricks.com/dev-tools/ide-how-to.h...

识别 SQL 表中的最新步骤序列

作者:idiocache 提问时间:3/8/2023

我有一个 SQL 表,其中包含两个不同配方的时间戳步骤序列。我试图找出一种识别“当前”或“最新”配方的方法。我的源表看起来有点像这样: 食谱 时间戳 步 1 2023-03-07 21:56:55 ...

SQL 中的 If/Else 问题以获取有效值

作者:Ichichaa 提问时间:5/31/2023

我想从 VBFA 表中获取 VBELN 字段。 但是为了获得有效值,我需要遵循以下逻辑: Get VBFA where FPLTR = ZTB_Driver-FPLTR AND FPLNR = Z...

PySpark 中的模糊匹配优化

作者:Minura Punchihewa 提问时间:4/24/2023

我正在尝试通过PySpark对某些数据进行一些模糊匹配。为此,我正在使用该包并在 Databricks 上运行它。fuzzywuzzy 我的数据集非常简单。它存储在 CSV 文件中,包含两列:Nam...

重新分区不适用于 Spark 中的 xml 文件

作者:Nemanja 提问时间:7/15/2023

我有数据帧,我想将其另存为多个xml文件。这是我的代码: employees .repartition(col("first_name")) .write() .option("maxRec...

如何在databricks SQL终结点中将YYYYMMDD字符串转换为日期?

作者:Rajashekhar 提问时间:8/4/2023

如何在databricks SQL终结点中将YYYYMMDD字符串转换为日期? 输入值:- 1.20230804 2. 20230805 输出值 :- 1.2023-08-04 2. 2...

当存在流式聚合时,不支持追加输出模式

作者:Greencolor 提问时间:8/9/2023

我有问题。正如这里提到的,我需要在下面的代码中将Append output mode not supported when there are streaming aggregationsmodifi...

SQL split() 中的正则表达式,用于将括在方括号中的逗号分隔字符串转换为数组,并从每个元素中删除周围的引号

作者:archjkeee 提问时间:8/25/2023

我有字符串数据列,其值如下所示: - ["some val1"] - [] - ["some val2", "some_val3"] - single value without brack...


共54条 当前第4页