求推荐好用的服务器集群监控系统

最近我们的 CI 系统升级了一下,开始使用 AWS EC2 Autoscaling,放弃了 Kubernetes (顺带吐槽一下 AWS 永远不会去修他们的 CNI bug )。

目前我们在使用 AWS Cloudwatch 来检测 autoscaling group 的健康状况,但只有很简单的信息像 CPU 负载等。我们计划部署一套服务器集群监控,请大家推荐一下自己觉得好用的。

需要的功能:

  1. 节点可以部署在我们一台服务器上
  2. 可以主动或被动发现新的服务器节点
  3. 需要统计 CPU/内存 /硬盘等信息
  4. 需要能够统计自定义信息,比如某台机器上的 docker container 数量
  5. 需要支持历史记录,比如查询在某个某个时间段内记录的信息
  6. 最好有 Web 截面
  7. 可以付费

相关文章

6 thoughts on “求推荐好用的服务器集群监控系统

发表评论

电子邮件地址不会被公开。 必填项已用*标注