监控指标与告警

 

监控指标

更新时间 2020-12-01

Nifi 集群提供资源性能监控指标和告警信息,以帮助用户更好的管理和维护运行中的 Nifi 集群。

  • 资源监控指标统计了云服务器的资源信息,如 CPU 使用率、硬盘 IOPS 情况等,可用于查看系统性能是否到达瓶颈。
  • 服务监控指标统计了用于性能分析的常用的 Metrics 信息,可用于定位分析数据库的性能。

注意:

Nifi 集群只用于监控集群的服务和资源指标,不会收除集除监控指标外的其它数据。 Nifi 虽然是单节点出现异常并不影响集群的正常服务,但越早发现问题并及时解决是维护整个集群长期正常运行的最佳实践。另外,由于 Nifi 有自我诊断与自我修复功能,通常情况这个告警只是一个提醒作用。

支持的服务监控指标

对每个节点提供了 Nifi 服务监控,包括节点的以下服务监控信息。

监控项 监控周期 单位 指标含义
总/已用/空闲/最大非堆内存大小 - MByte 统计 JVM 的非堆内存使用大小。
总/已用/空闲/最大堆内存大小 - MByte 统计 JVM 的堆内存使用大小。
堆内存占用百分比 - % 统计 JVM 的堆内存使用百分比。
可用处理器 - counts 统计集群可以使用的处理器数量。一个 JVM 对应了一个处理器。
处理器平均读取时间 - ms 统计处理器的平均响应时间。
总守护线程数 - counts 统计守护线程数量。
流程文件存储空间大小及占用百分比 - % 统计 flowfile 的元信息存储空间使用率。
流程内容存储空间大小及占用百分比 - % 统计 flowfile 的内容存储空间使用率。
数据源存储空间大小及占用百分比 - % 统计控制原始数据存储空间使用率。

支持的资源监控指标

通过云监控告警服务为集群服务器的资源和服务提供监控管理。当集群监控项超过阈值时触发告警,并通过短信、邮件等形式发送告警通知。

监控项 监控周期 单位 指标含义
CPU 5分钟 % 统计当前资源 CPU 使用率。
以 % 为单位。
内存 5分钟 % 统计当前资源内存使用率。
以 % 为单位。
硬盘使用率 5分钟 % 统计当前资源硬盘使用率。
以 % 为单位。
硬盘 IOPS 5分钟 counts/s 统计每秒资源硬盘 IOPS 读取或写入次数,可分别查看读取或写入监控指标。
以次每秒为单位。
硬盘吞吐量 5分钟 MByte/s 统计每秒资源硬盘读取或写入速率,可分表获取读取或写入速率。
以 MByte 每秒为单位。
这篇文档解决了您的问题吗?
0
0