动态 Spark 结构化流式处理:通过更改处理流-流联接

Dynamic Spark Structured Streaming: Handling Stream-Stream Joins with Changing

提问人:Baubau Tran 提问时间:11/16/2023 更新时间:11/16/2023 访问量:14

问:

我想使用 Spark 结构化流式处理创建一个简单的应用程序,以便在股价数据满足特定要求时提醒用户(通过电子邮件、短信等)。

我有一个数据流:data_stream

但是,我正在努力解决主要问题:用户如何随时修改要求(设置)。

我正在考虑使用另一个名为 settings_stream 的流,然后加入这两个流。但是,我已经意识到加入这些流会给用户带来许多不必要的警报。例如,当用户更改设置时,新要求将过滤所有旧价格数据(而不仅仅是最新价格),同样,当新价格数据到达时。

例如:

1.
Price | Timestamp
1     | 00:00
2     | 00:01
3     | 00:05

使用新设置:价格 >= 1 => 3 封电子邮件

2.

PriceRule | Timestamp
=1 | 00:01
=2 | 00:05

最新价格:价格 = 1 => 2 封电子邮件

我该如何处理这种情况?或者,除了流-流连接之外,您能否为这个用例提供一些解决方案?

PS:我的项目必须利用 Kafka 和 Spark Streaming/Structured Streaming。

非常感谢大家!

apache-spark apache-spark-sql 大数据 spark-streaming spark- 结构化流式处理

评论


答: 暂无答案