Kubernetes是Google开源的容集群管系统,是Google多规模容管技术Borg的开源版本,主要功能包括:
基于容器的应用部署、维护和滚动升级
负载均衡和服务发现
跨机器和跨地区的集群调度
自动伸缩
无状态服务和有状态服务
广泛的Volume支持
插件机制保证扩展性
Kubernetes发展非常迅速,已经成为容器编排领域的领导者,接下来我们将讲解Kubernetes中涉及到的一些主要概念。
1、PodPod是一组紧密关联的容器集合,支持多个容器在一个Pod中共享网络和文件系统,可以通过进程间通信和文件共享这种简单高效的方式完成服务,是Kubernetes调度的基本单位。Pod的设计理念是每个Pod都有一个唯一的IP。
Pod具有如下特征:
包含多个共享IPC、Network和UTCnamespace的容器,可直接通过localhost通信所有Pod内容器都可以访问共享的Volume,可以访问共享数据优雅终止:Pod删除的时候先给其内的进程发送SIGTERM,等待一段时间(graceperiod)后才强制停止依然还在运行的进程特权容器(通过SecurityContext配置)具有改变系统配置的权限(在网络插件中大量应用)支持三种重启策略(restartPolicy),分别是:Always、OnFailure、Never支持三种镜像拉取策略(imagePullPolicy),分别是:Always、Never、IfNotPresent资源限制,Kubernetes通过CGroup限制容器的CPU以及内存等资源,可以设置request以及limit值健康检查,提供两种健康检查探针,分别是livenessProbe和redinessProbe,前者用于探测容器是否存活,如果探测失败,则根据重启策略进行重启操作,后者用于检查容器状态是否正常,如果检查容器状态不正常,则请求不会到达该PodInitcontainer在所有容器运行之前执行,常用来初始化配置容器生命周期钩子函数,用于监听容器生命周期的特定事件,并在事件发生时执行已注册的回调函数,支持两种钩子函数:postStart和preStop,前者是在容器启动后执行,后者是在容器停止前执行2、NamespaceNamespace(命名空间)是对一组资源和对象的抽象集合,比如可以用来将系统内部的对象划分为不同的项目组或者用户组。常见的pod、service、replicaSet和deployment等都是属于某一个namespace的(默认是default),而node,persistentVolumes等则不属于任何namespace。
常用namespace操作:
kubectlgetnamespace,查询所有namespacekubectlcreatenamespacens-name,创建namespacekubectldeletenamespacens-name,删除namespace删除命名空间时,需注意以下几点:
删除一个namespace会自动删除所有属于该namespace的资源。default和kube-system命名空间不可删除。PersistentVolumes是不属于任何namespace的,但PersistentVolumeClaim是属于某个特定namespace的。Events是否属于namespace取决于产生events的对象。3、NodeNode是Pod真正运行的主机,可以是物理机也可以是虚拟机。Node本质上不是Kubernetes来创建的,Kubernetes只是管理Node上的资源。为了管理Pod,每个Node节点上至少需要运行containerruntime(Docker)、kubelet和kube-proxy服务。
常用node操作:
kubectlgetnodes,查询所有nodekubectlcordonnodename,将node标志为不可调度kubectluncordonnodename,将node标志为可调度taint(污点)
使用kubectltaint命令可以给某个Node节点设置污点,Node被设置上污点之后就和Pod之间存在了一种相斥的关系,可以让Node拒绝Pod的调度执行,甚至将Node已经存在的Pod驱逐出去。每个污点的组成:key=value:effect,当前tainteffect支持如下三个选项:
NoSchedule:表示k8s将不会将Pod调度到具有该污点的Node上PreferNoSchedule:表示k8s将尽量避免将Pod调度到具有该污点的Node上NoExecute:表示k8s将不会将Pod调度到具有该污点的Node上,同时会将Node上已经存在的Pod驱逐出去常用命令如下:
kubectltaintnodenode0key1=value1:NoShedule,为node0设置不可调度污点kubectltaintnodenode0key-,将node0上key值为key1的污点移除kubectltaintnodenode1node-role.kubernetes.io/master=:NoSchedule,为kube-master节点设置不可调度污点kubectltaintnodenode1node-role.kubernetes.io/master=PreferNoSchedule,为kube-master节点设置尽量不可调度污点容忍(Tolerations)
设置了污点的Node将根据taint的effect:NoSchedule、PreferNoSchedule、NoExecute和Pod之间产生互斥的关系,Pod将在一定程度上不会被调度到Node上。但我们可以在Pod上设置容忍(Toleration),意思是设置了容忍的Pod将可以容忍污点的存在,可以被调度到存在污点的Node上。
4、ServiceService是对一组提供相同功能的Pods的抽象,并为他们提供一个统一的入口,借助Service应用可以方便的实现服务发现与负载均衡,并实现应用的零宕机升级。Service通过标签(label)来选取后端Pod,一般配合ReplicaSet或者Deployment来保证后端容器的正常运行。
service有如下四种类型,默认是ClusterIP:
ClusterIP:默认类型,自动分配一个仅集群内部可以访问的虚拟IPNodePort:在ClusterIP基础上为Service在每台机器上绑定一个端口,这样就可以通过NodeIP:NodePort来访问该服务LoadBalancer:在NodePort的基础上,借助cloudprovider创建一个外部的负载均衡器,并将请求转发到NodeIP:NodePortExternalName:将服务通过DNSCNAME记录方式转发到指定的域名另外,也可以将已有的服务以Service的形式加入到Kubernetes集群中来,只需要在创建Service的时候不指定Labelselector,而是在Service创建好后手动为其添加endpoint。
5、Volume存储卷默认情况下容器的数据是非持久化的,容器消亡以后数据也会跟着丢失,所以Docker提供了Volume机制以便将数据持久化存储。Kubernetes提供了更强大的Volume机制和插件,解决了容器数据持久化以及容器间共享数据的问题。
Kubernetes存储卷的生命周期与Pod绑定
容器挂掉后Kubelet再次重启容器时,Volume的数据依然还在Pod删除时,Volume才会清理。数据是否丢失取决于具体的Volume类型,比如emptyDir的数据会丢失,而PV的数据则不会丢目前Kubernetes主要支持以下Volume类型:
emptyDir:Pod存在,emptyDir就会存在,容器挂掉不会引起emptyDir目录下的数据丢失,但是pod被删除或者迁移,emptyDir也会被删除hostPath:hostPath允许挂载Node上的文件系统到Pod里面去NFS(NetworkFileSystem):网络文件系统,Kubernetes中通过简单地配置就可以挂载NFS到Pod中,而NFS中的数据是可以永久保存的,同时NFS支持同时写操作。glusterfs:同NFS一样是一种网络文件系统,Kubernetes可以将glusterfs挂载到Pod中,并进行永久保存cephfs:一种分布式网络文件系统,可以挂载到Pod中,并进行永久保存subpath:Pod的多个容器使用同一个Volume时,会经常用到secret:密钥管理,可以将敏感信息进行加密之后保存并挂载到Pod中persistentVolumeClaim:用于将持久化存储(PersistentVolume)挂载到Pod中6、PersistentVolume(PV)持久化存储卷PersistentVolume(PV)是集群之中的一块网络存储。跟Node一样,也是集群的资源。PersistentVolume(PV)和PersistentVolumeClaim(PVC)提供了方便的持久化卷:PV提供网络存储资源,而PVC请求存储资源并将其挂载到Pod中。
PV的访问模式(accessModes)有三种:
ReadWriteOnce(RWO):是最基本的方式,可读可写,但只支持被单个Pod挂载。ReadOnlyMany(ROX):可以以只读的方式被多个Pod挂载。ReadWriteMany(RWX):这种存储可以以读写的方式被多个Pod共享。不是每一种存储都支持这三种方式,像共享方式,目前支持的还比较少,比较常用的是NFS。在PVC绑定PV时通常根据两个条件来绑定,一个是存储的大小,另一个就是访问模式。
PV的回收策略(persistentVolumeReclaimPolicy)也有三种
Retain,不清理保留Volume(需要手动清理)Recycle,删除数据,即rm-rf/thevolume/*(只有NFS和HostPath支持)Delete,删除存储资源7、Deployment无状态应用一般情况下我们不需要手动创建Pod实例,而是采用更高一层的抽象或定义来管理Pod,针对无状态类型的应用,Kubernetes使用Deloyment的Controller对象与之对应。其典型的应用场景包括:
定义Deployment来创建Pod和ReplicaSet滚动升级和回滚应用扩容和缩容暂停和继续Deployment常用的操作命令如下:
kubectlrun