提问人:Baubau Tran 提问时间:11/16/2023 更新时间:11/16/2023 访问量:14
动态 Spark 结构化流式处理:通过更改处理流-流联接
Dynamic Spark Structured Streaming: Handling Stream-Stream Joins with Changing
问:
我想使用 Spark 结构化流式处理创建一个简单的应用程序,以便在股价数据满足特定要求时提醒用户(通过电子邮件、短信等)。
我有一个数据流:data_stream
但是,我正在努力解决主要问题:用户如何随时修改要求(设置)。
我正在考虑使用另一个名为 settings_stream 的流,然后加入这两个流。但是,我已经意识到加入这些流会给用户带来许多不必要的警报。例如,当用户更改设置时,新要求将过滤所有旧价格数据(而不仅仅是最新价格),同样,当新价格数据到达时。
例如:
1.
Price | Timestamp
1 | 00:00
2 | 00:01
3 | 00:05
使用新设置:价格 >= 1 => 3 封电子邮件
2.
PriceRule | Timestamp
=1 | 00:01
=2 | 00:05
最新价格:价格 = 1 => 2 封电子邮件
我该如何处理这种情况?或者,除了流-流连接之外,您能否为这个用例提供一些解决方案?
PS:我的项目必须利用 Kafka 和 Spark Streaming/Structured Streaming。
非常感谢大家!
答: 暂无答案
评论