容器云平台是否有完善的监控工具可以监控pod、k8s集群的运行情况并提供告警,是否可实现容量分析,例如我现在的最大副本设置可能会造成资源不足,可以查看到所有pod的历史资源使用情况
收起对于监控来说,我们可以分为2个维度的监控:
1、基础设施的监控,具体表现的是物理机的状态;
2、应用程序或者说是进程级别的监控,比如redis的监控,mysql数据等等。
此类监控可以使用如zabbix,promethus,Grafana等工具来实现。
对于POD的监控而言,涉及到了进程落到基础设施资源的上,需要判断基础设施资源是否能否满足POD伸缩的要求,为做到POD的资源可控,首先对于每个pod在程序开发阶段进行压测,评估pod的运行的最大CPU和内存的要求,当pod副本增加时能根据实际情况将Pod分配到资源合理的主机,减少pod因为物理机资源不足而重新被二次分配的情况。
整体k8s的集群监控可以使用一些容器管理平台的第三方软件来管理,如rancher,可以很快拿到当前系统的资源占有率,如CPU、内存的剩余情况,POD当前的数量。