监控指标与告警

 

查看资源和服务监控

更新时间 2020-12-01

ClickHouse 监控告警是通过云监控告警服务为集群服务器的资源和服务提供监控管理。当集群监控项超过阈值时触发告警,并通过短信、邮件等形式发送告警通知。

云监控 CloudSat 可对 ClickHouse 的运行状态进行日常监控。您可以通过 CloudSat 管理控制台,一站式监控和告警 ClickHouse 各类服务、资源指标。您可以在 ClickHouse 集群详情页面,查看主实例监控和查看备实例监控。

注意

由于云监控 CloudSat 默认监控扫描周期为5分钟,则当前显示5~10分钟前的集群状态。

前提条件

  • 已获取管理控制台登录账号和密码,且已获取集群查看权限。

  • 已创建 ClickHouse 集群,集群状态为活跃,且服务状态为正常

    说明

    更新中、异常、删除状态的集群,无法获取其监控指标。当集群重启或恢复后,即可正常查看。

  • 集群服务已正常运行一段时间。

    说明

    监控扫描周期默认为5分钟,新增节点暂无法查看监控信息。

查看监控指标

  1. 在集群管理页面,点击目标集群 ID,进入集群详情页面。

  2. 节点页签,选中目标节点监控

    • 通过切换服务资源,可分别查看对应节点服务和资源监控指标状态。

    • 通过切换时间区段,可分别查看不同时间段内集群性能状态。

      可选中最近6小时最近一天最近两周最近一个月最近6个月

    • 您也可以通过自定义连续7天的起止时间,查看目标时间段内指标状态。

      但最多仅能查询近90天内数据。

查看实时监控

  1. 在集群管理页面,点击目标集群 ID,进入集群详情页面。

  2. 节点页签,选中目标节点监控

  3. 查看实时服务指标状态。

    切换到服务资源指标,点击关闭状态按钮,开启实时监控。

    说明

    开启一个服务指标实时监控,默认开启全部服务指标实时监控。

    每一个资源指标实时监控,需单独开启。

这篇文档解决了您的问题吗?
0
0