为 gcp 错误报告服务指定单个 gke 集群

Specify a single gke cluster for gcp error reporting service

提问人:Ahmed Elsherbiny 提问时间:8/25/2022 更新时间:9/2/2022 访问量:196

问:

我有多个 gke 集群(stg、dev、prod),并且我正在使用错误报告服务来获取有关错误的警报,所以无论如何都可以根据 gke 集群名称过滤错误,例如(仅从 prod 集群获取错误)

google-cloud-platform google-kubernetes-engine google-cloud-stackdriver google-cloud-error-reporting

评论


答:

0赞 Gabriel Robledo Ahumada 9/2/2022 #1

简短的回答是:这在错误报告中是不可能的,因为只有几个文本匹配过滤器可以应用,而且它们都不能用作集群的标识符。

话虽如此,有一种方法可以针对特定集群的 Cloud Logging 中看到的错误获取警报。只需使用您自己的集群名称在 Cloud Logging Logs Explorer 中运行以下查询即可:

resource.type="k8s_pod"
resource.labels.cluster_name="your-cluster-name"
jsonPayload.message:"error"

运行后,单击“创建警报”按钮;将出现一个演练向导,您可以在其中通过设置计时器、通知通道等来自定义它。

评论

0赞 Ahmed Elsherbiny 9/4/2022
感谢您的回答,关于第二部分,我已经在多种场景中使用了这种方式,但在这种情况下,我会遇到很多错误,使用它会导致发送大量错误警报。
0赞 Gabriel Robledo Ahumada 9/8/2022
@AhmedElsherbiny错误报告和 Cloud Logging 中看到的错误相同,但唯一的区别是,默认情况下,错误报告会根据错误类型进行分类,而在 Cloud Logging 中,您可以通过设置支持过滤器来执行相同的操作。
0赞 Ahmed Elsherbiny 9/10/2022
我知道日志资源管理器和云日志记录中存在错误,但是错误报告组错误然后发送它们的报告,我认为这在云日志记录中是不可行的,所以如果有办法这样做,那将是我的情况的一个很好的解决方案。
0赞 Gabriel Robledo Ahumada 9/16/2022
当然,这在云日志记录中是可行的,您可以自定义过滤器以捕获您想要的错误级别,然后仅为该过滤器创建警报,我不会详细说明如何做到这一点,因为这将是一个新问题。如果答案对您有用,请考虑投票或接受答案。