2020 容器云职业技能大赛运维管理岗课程系列之—容器云平台重大问题的分析、定位及排除
正在加载中...
课程出品人
陈强,目前就职于上汽集团云计算中心,容器云架构师及技术经理;长年在云计算领域搬砖,曾就职于Intel, IBM, 爱奇艺 等公司;有五年基于Docker/Mesos/Kubernetes的云容器研发经验,积累了丰富的生产实践经验,专注于云原生技术的研究。2020容器云职业技能大赛百位专家委员会成员。
课程简介
随着容器技术的出现,我们开发出的应用程序才可以真正实现开发运维一体化的愿景,因为它比传统虚拟机定义了更具标准化的打包方式及更轻量级的运行状态。当业务很多时,如果我们只在一台主机上部署就不能满足业务的高可用、负载的可扩容性等需求,这时就需要我们在多台主机上部署,因此出现了集群化、分布式等技术。那我们如何在这些主机上更高效的管理这些容器,并以某些方式暴露所部署的应用服务?这就需要用到容器编排技术了,因此从2014年开始,容器领域就诞生了以Mesos、Docker Swarm及Kubernetes为代表的容器编排系统。在过去这几年间,容器编排技术已经呈现出“三国鼎立”之态势,各有个的用户群体,各有个的活动社区,但2017年至今Kubernetes已经成为真正的领导者。一种新的技术的兴起,注定会带动围绕其出现的其他新技术的崛起,这包括了容器存储、容器网络、容器日志管理及监控告警、CI/CD(持续集成/持续交付)等相关领域的技术,从而构成了我们今天火热的容器生态圈。在容器编排技术之上,我们为了更好的让开发者使用这个编排系统,就有了容器平台的出现,典型开源代表有Rancher、Openshift、Kubesphere等,它们都包括CI/CD、灰度发布、滚动升级、自动扩缩容、租户管理、安全认证等等功能模块。每一个模块也都涌现出了很多新的技术代表,这些又构成了我们今天大势宣传的云原生技术。那这么多新技术组合在一起,当我们的容器平台或者部署在其上的业务出现问题时,我们该如何分析、定位并最后排除?这就是一个摆在云容器工作者面前的重要问题。在这个章节中我就分享一些解决问题的思路、方法,并以一个实际案例来分享如何排除一个真实场景中产生的问题,希望能起到抛砖引玉的效果,并对大家有所帮助。由于容器平台涉及的问题太过宽广,使用的技术涉及知识面也很多,本章节并不能一一例举,只能点到为止。
已下载用户的评价8.28分
查看我的 待评价资源