K8S集群自动化运维方案-FreeNAS中文网

admin 管理员组

文章数量: 887021

2023年12月22日发(作者：熊猫ppt模板官网)

K8S集群自动化运维方案

一、K8S前序知识..................................................................................................................................... 3

二、项目背景 .............................................................................................................................................. 6

三、技术实现方案 ..................................................................................................................................... 8

四、总结 .................................................................................................................................................... 14

“大规模Kubernetes集群”主要体现在几十个Kubernetes集群，十万级别的Kubernetes

Worker节点。蚂蚁金服使用Operator的模式去运维Kubernetes集群，能便捷、自动化的管理Kubernetes集群生命周期，做到“Kubernetes as a Service”。

本文分享了自动化运维大规模Kubernetes集群的实践经历，比较适合Kubernetes爱好者，Kubernetes架构师，以及PE/SRE阅读。

一、K8S前序知识

1. Kubernetes架构介绍

此章节简单介绍了Kubernetes集群的架构，主要是面向刚学习Kubernetes的同学，对于熟悉Kubernetes的同学，此章节可以跳过。

如上图，一个Kubernete集群由Master节点和Worker节点组成。

在一个高可用Kubernetes集群下面，Master节点一般为3台，在它们上面需要运行Kubernetes Master组件。Kubernetes Master组件包括etcd、Apsierver、Scheduler和Controller-Manager。每个Master组件一般都是3个实例，以保证它们的高可用。Master节点使用Static Pod方式启动Master组件，即将每个组件的Pod描述文件放入Master节点的指定目录，Kubelet会在启动时将它们读取，并以Static Pod方式启动。

Kubernetes Worker节点为Kubernetes集群提供调度资源和应用运行环境，即所有的Pod（可以理解为应用的一个个最小化部署单元）都运行在Worker节点上。一个Worker节点4

将Pod运行上去需要一些on-host软件，包括: kubelet、Runtime Service（docker、pouch等实现方案）、CNI插件等。

2. Operator介绍

我们在这里将用很少的篇幅向刚学习Kubernetes的同学介绍一下Operator。如果期望获得更详细的解读，请参考coreos上关于Operator的介绍。

一个Operator实际上是为了解决某个复杂应用在Kubernetes的自动化部署、恢复。有了Operator，用户只需要向Kubernetes Apiserver提交一个CRD Resource（yaml或者JSON，一个CRD Resource其实就是对应一个应用实例，CRD Resource用于描述这个应用实例的配置），Operator就会根据用户的需求去完成这个应用实例的初始化，在应用某个模块发生故障时，Operator也会做出自动恢复功能。Operator是用代码运维应用最好的实践之一。

比如我们有一个etcd-operator，我们只需要用户根据需求向Kubernetes Apiserer提交如下的CRD Resource，etcd-operator就能初始化完成一个etcd集群:

apiVersion: /v1beta2

kind: EtcdCluster

metadata:

name: xxx-etcd-cluster

spec:

size: 5

其中，上面的=5代表了我们需要一个由5个etcd节点组成的etcd集群。etcd-operator会根据上面的配置，初始化完成etcd集群。相应的，如果你又需要另一个3节点的etcd集群，你只需要提交新的一个=3的CRD Resource即可。

二、项目背景

在蚂蚁金服，我们面临着需要运维几十个Kubernetes集群，以及十万级别以上的Kubernetes

Worker节点的难题。

我们将运维Kubernetes的工作拆分两部分：



运维Kubernetes集群的Master组件（etcd、Apiserver、controller-manager、scheduler等）；



运维Kubernetes Worker节点。

我们总结了这两部分运维的难点：

难点1：运维Kubernetes集群Master角色



如何快速新建、下线一个Kubernetes集群（初始化、删除 Master 角色）？由于蚂蚁业务的快速增长，我们随时面临着需要在新机房新建、下线一个 Kubernetes集群；CI和测试也有快速新建、删除一个Kubernetes集群的需求。



如何管理几十个Kubernetes集群Master组件版本。比如我们需要升级某几个Kubernetes集群的Apiserver、Scheduler等组件。



如何自动化处理几十个Kubernetes集群Master组件发生的故障？

如何能获取几十个Kubernetes集群Master组件的统一视图？我们希望有一个统一的接口，一下就能获取每个Kubernetes集群Master角色的版本、状态等信息。

难点2：运维Kubernetes Worker节点



如何快速上线、下线Kubernetes Worker节点？上线时，我们需要保证Kubernetes Worker节点所需要的on-host软件版本、配置正确。



如何升级十万级别的Kubernetes Worker节点上的on-host软件？如我们需要将所有Work节点的docker、cni版本升级到某个版本。



如何优雅的执行灰度发布Kubernetes Worker节点上的软件包？在on-host软件新版本上线前，我们需要对它做小范围的灰度发布，即挑选N台Worker节点发布新版本软件包，执行验证，最后根据验证结果决定是否全规模的发布新版本，或者回滚这个灰度发布。



如何自动化处理十万级别的Kubernetes Worker节点可能出现的on-host软件故障？比如要是dockerkubelet发生panic，我们是否能自动化得处理？

三、技术实现方案

在实现方案的选择上，我们使用了Kube-on-Kube-Operator和Node-Operator组合的方式来解决上述的难题：



首先，我们需要借助工具，使用Kubernetes官方提供的方案（Static Pod 方式）部署“Kubernetes 元集群”（后面简称元集群）到“元集群”的Master节点上。



然后，我们将Kube-on-Kube-Operator部署到“ Kubernetes元集群”。我们将一个Kubernetes集群所需的一系列Master组件当成一个复杂的应用。当我们需要一个“Kubernetes业务集群”（后面简称业务集群），我们只需要向元集群Apiserver提交用于描述“Kubernetes业务集群”的Cluster CRD Resource （下文会介绍我们如何设计CRD结构），Kube-on-Kube-Operator就为我们准备好了一个可以工作的“Kubernetes 业务集群”（“业务集群”Master组件都已经Ready，需要扩容Worker节点）。



之后我们在“Kubernetes 业务集群”上，部署上Node-Operator。Node-Operator负责Worker节点的生命周期。当我们需要扩容一个Worker节点，我们只需要提交描述Worker节点的元数据（IP、Hostname、机器运维登录方式等）的Machine CRD Resource（下文会介绍我们如何设计CRD结构），Node-Operator就会将Worker节点初始化完成，并成功加入到 “Kubernetes 业务集群”中。

“元集群”只用于管理所有“业务集群”所需的Master组件。“业务集群”是真正提供给业务方运行Pod的Kubernetes集群。也就说，在蚂蚁金服我们只有一个“元集群”，在这个“元集群”中，我们使用Kube-on-Kube-Operator自动化管理了蚂蚁金服所有的“Kubernetes 业务集群”的Master组件。

当然，“元集群”也会部署Node-Operator，用于“元集群”Worker节点的上下线，“元集群”的Worker节点也是各个“业务集群”的Master节点。

1. Kube-on-Kube-Operator

Kube-on-Kube-Operator用于Watch Cluster CRD Resource的变更，将“Cluster”所描述表示的Kubernetes业务集群的所有Master组件达到最终状态。如下图，是“元集群”和它所管理的两个“Kubernetes 业务集群”的最终状态：

Cluster CRD的定义包含如下一些信息：



业务集群名；

业务集群部署模式：分为标准生产和最小化。标准生产提供Master组件都是3个副本的部署，最小化则都是1个副本的部署；



业务集群Master节点NodeSelector，即表示如何在元集群内如何选择业务集群Master节点；



业务集群各Master组件版本、自定义参数等；

业务集群所使用的etcd启动配置，主要涉及etcd data volume的设置，有ClaimTemplate和VolumeSource两种模式：

使用ClaimTemplate模式，即使PVC来初始化etcd volume；

使用VolumeSource模式，即使用VolumeSource所表示的volume来挂载etcd volume；



业务集群Master组件证书过期时间：Master组件所使用kubeconfig中的证书都有过期时间以保证安全性，而Kube-on-Kube-Operator会在证书过期时自动完成滚动证书、Master组件重新加载证书等操作。



业务集群额外用户kubeconfig：即为“额外用户”提供的用户名和组名，签出证书，并生成kubeconfig保存在元集群Secret中供读取。



业务集群状态：这部分信息不需要用户提交，而是由Kube-on-Kube-Operator自动生成，用户反馈这个业务集群的状态，参考。

一个业务集群的Master组件部署实际是元集群中的一系列Resource组成，即包括Deployment、Secret、Pod、PVC等组合使用。各Master组件所需要的部署Resource如下：



Apiserver：一个Deployment即可，因为Apiserver是无状态应用，副本数和Cluster CRD描述的一致即可。除此之外，需要为Apiserver创建两个Service：

a. 向同个业务集群的其它Master组件提供服务的Service——建议使用元集群内的

Headless Service。

b. 向Kubelet、外部组件提供服务的Service——建议使用机房DNS RR Service （需要自己实现Service Controller）。



etcd：每个etcd实例（标准化部署是3个实例，最小化是1个实例）都建议单独使用Pod +

PV + PVC + Headless Service部署。每个etcd实例的peer id为对应的Headless Service域名。当某个etcd实例发生故障时，需要手动删除掉故障对应实例的Pod，Kube-on-Kube-Operator watch到etcd Pod的减少，会重新建立Pod，并执行Remove old

member（被删除的 Pod），Add new member（新建的Pod）操作，但是peer id还是保持一致的。



Controller-Manager：一个Deployment即可，因为Controller-Manager是无状态应用。副本数和Cluster CRD描述的一致即可。



Scheduler：一个Deployment即可，因为Scheduler是无状态应用。副本数和Cluster CRD描述的一致即可。

Kube-on-Kube-Operator除了能够部署上述的Master组件之外，还能维护任何扩展组件，如kube-proxy、kube-dns等。只需要用户提供扩展组件部署模板和扩展插件版本，Kube-on-Kube-Operator能渲染出部署Resource，并保持这些部署Resource到最终态。由于篇幅原因，我们这里不再赘述。

Node-Operator

Node-Operator用于Watch Machine CRD Resource的变更，将“Machine”所描述表示的Worker节点上的on-host软件（docker、kubelet、cni）达到最终态，最终能让“Machine”所对应的“Node”在Kubernetes集群中达到“Ready”状态。架构图如下:

Machine CRD的定义包含如下一些信息：



机器元数据：IP、Hostname、IDC 等；

机器运维SSH登录方式和登录秘钥：如最常见的 SSH Key；如果 Machine 是阿里云的ECS，那么登录方式和登录秘钥是阿里云提供的SSH接口和对应的鉴权信息等；



各个on-host软件版本和自定义参数；

Machine状态：这部分信息不需要用户提交，而是由Node-Operator生成，表示这个机器的当前状态，参考。

Node-Operator用Watch Machine对应Node的状态，当发生一些能处理的Condition（比如kubelet运行中进程消失了）时，Node-Operator会做出恢复处理；Node-Operator会Watch ClusterPackageVersion CRD的变更，这个CRD表示整个Kubernetes集群kubelet、docker等组件的默认版本，Node-Operator会根据ClusterPackageVersion描述的信息，控制各个节点的kubelet、docker等组件的版本；Node-Operator还支持控制某些组件灰度发布到某些节点中，用户只要提交描述这个灰度发布的CRD到Apiserver，Node-Operator会有序的执行灰度发布，并将发布状态反馈到CRD中。由于篇幅原因，我们不再赘述。

四、总结

在运维大规模Kubernetes集群的实践中，我们摈弃了传统的模式，使用了Operator模式和面向Apiserver编程。Kubernetes集群的上下线、升级实现了“Kubernetes as a

Service”，就像向云厂商买一个服务一样简单。而Worker节点的运维，使用Operator模式能够让我们统一管理元数据，自动化初始化、恢复Worker节点所需组件。

本文标签：集群组件节点需要业务

版权声明：本文标题：K8S集群自动化运维方案内容由网友自发贡献，该文观点仅代表作者本人，转载请联系作者并注明出处：http://www.freenas.com.cn/jishu/1703182033h441296.html，本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容，一经查实，本站将立刻删除。

技术交流 – FreeNAS中文网

K8S集群自动化运维方案

更多相关文章

win11下制作u盘pe系统(电脑店,大白菜),提示程序组件不完整

电脑重装系统后Win10如何添加系统组件

Hadoop集群环境配置及安装配置（详细过程包含安装包）

天翼云服务器性能评测，4H8G贵阳节点性能跑分

Windows XP系统IIS5.1组件下载和安装方法

Hadoop高手之路2—Hadoop集群的基础设置

Win11系统小组件打不开？Win11系统小组件无法打开解决方法

windows 虚拟机相关功能、组件梳理

【miniconda&amp;Windows高版本cuda安装Comfyui-CatVTON超级踩坑尝试环境安装成功，但是运行节点时只有国内环境工作流无法完成】

android gridview 图片错位,android GridView组件多列加载图片时错位问题

hadoop集群之centos网络配置

Windows下的RabbitMQ安装：集群与镜像

IDC云灾备白皮书：云灾备支持未来业务持续性新需求

桌面云组件介绍与安装

windows xp组件中没有IIS选项的解决方案

【粉丝福利社】《推荐系统全链路设计：原理解读与业务实践》（文末送书-进行中）

软件架构业务及技术复杂度分析总结

前端学习笔记 | Vue组件化编程

使用ADB命令-停用华为手机系统更新组件

重拾语音识别功能：WIN7(x64位)语音识别组件包推荐

发表评论

推荐文章

七、安卓手机环境检测软件分享

文本相似度：Neural Network Models for Paraphrase Identification, Semantic Textual Similarity, NLI and QA

千兆网络变压器：1000base

计算机信息专业致谢词,计算机专业的论文致谢

笔记本里的固态硬盘坏掉了怎么办

热门文章

涨薪跳槽利器，清华大咖总结的 Java 核心突击讲，一应俱全

Python居然能发送企业微信消息？

a标签的mailto属性 针对于邮件的调用

机器学习 DBSCAN聚类算法

php控制台读取数据库信息,php

人工智能第二课

windows下V-Rep下载及安装教程

问题：windows日志系统事件36887造成电脑蓝屏重启

win11启动“适用于Linux的windows的子系统“多次无法打开，重启电脑时总是撤销操作的可能解决方法

Win10系统备份的几种方案，以后不重装系统，备份系统恢复Backup，系统映像备份

最新文章

Raid技术

LSI_阵列卡操作手册

破解Centos7_root用户密码

Redhat重置Root用户密码方法

远程批量修改linux服务器密码的脚本

Windows7 系统安全设置权限技巧

（Windows系统）详细介绍Windows系统 含有英文版

最新Windows 11教育版下载：专为教育设计的系统！

Win7系统下搭建NFS服务器

零基础使用UltraISO制作并安装纯净Win10系统指南

【miniconda&Windows高版本cuda安装Comfyui-CatVTON超级踩坑尝试环境安装成功，但是运行节点时只有国内环境工作流无法完成】

a标签的mailto属性针对于邮件的调用

（Windows系统）详细介绍Windows系统含有英文版