在 Java 应用程序中使用 Databricks 数据库数据的最佳方式是什么?[关闭]

What is the best way to consume Databricks database data in Java application? [closed]

提问人:Ramesh Bathini 提问时间:11/11/2023 最后编辑:Alex OttRamesh Bathini 更新时间:11/19/2023 访问量:23

问:


想改进这个问题吗?更新问题,以便可以通过编辑这篇文章用事实和引文来回答。

9天前关闭。

我需要检索存储在 Databricks 平台中的数据。我可以看到可以使用 Databricks-SDK 以及 Databricks API 路由来实现它,但在任何地方都看不到获取数据的最佳方式。

如果您能看到其他更好的方法,请告诉我。

非常感谢这里的任何帮助/建议。

Java 集成 Databricks-SQL

评论


答:

1赞 Alex Ott 11/11/2023 #1

对于 Spring,最简单的方法是使用 Databricks JDBC 驱动程序,该驱动程序可提供非常好的性能,尤其是在需要提取大量数据时。驱动程序在 Maven Central 上提供,坐标如下:

<dependency>
    <groupId>com.databricks</groupId>
    <artifactId>databricks-jdbc</artifactId>
    <version>2.6.34</version>
    <scope>runtime</scope>
</dependency>

之后,您可以通过 JDBC url 将其用作另一个 JDBC 数据源,例如(确切的字符串取决于配置)。我有一个小例子,在 Spring 中使用它(虽然不是很惯用)。jdbc:databricks://...

另一种方法是使用 Databricks SQL 语句执行 REST API,但通常需要更多的工作来进行身份验证、等待结果、解码数据等。尽管 Databricks Java SDK 简化了其用法,但如果你不想使用 JDBC,可以使用它。