Kubernetes 实战——有状态应用（StatefulSet）

发表评论
352 次浏览

A+

所属分类：linux技术

摘要

ReplicaSet 通过 Pod 模板创建多个 Pod 副本，这些副本除了名字和 IP 地址不同，没有其他差异。若 Pod 模板指定了 PVC，则其创建的所有 Pod 共享相同的 PVC 和 PV

便宜好用的国外VPS推荐

一、简介

有状态实例：新实例和旧实例需要有相同的名称、网络标识和状态
无状态实例：可随时被替换

1. ReplicaSet 和有状态 Pod

Kubernetes 实战——有状态应用（StatefulSet）

集群应用可能要求实例具有唯一的网络标识。可针对每个实例创建一个独立的 Service 来提供稳定的网络地址（因为服务 IP 固定）。但 Pod 无法获取该 IP，不能在别的 Pod 里通过 IP 自行注册

Kubernetes 实战——有状态应用（StatefulSet）

2. 了解 StatefulSet

每一个实例不可替代，都拥有稳定的名字（从零开始的顺序索引）和状态（独立的数据卷）
有状态的 Pod 有时需要通过其主机名来定位。因为彼此状态不同，通常希望操作的是指定的那个
- 一个 StatefulSet 常要求创建一个用来记录每个 Pod 网络标记的 headless Service。通过该 Service，每个 Pod 将拥有独立的 DNS 记录，这样集群中的 Pod 或客户端可以通过主机名来定位
- 如一个 default 命名空间，名为 foo 的服务，它的一个 Pod 名为 a-0，就可以通过a-0.foo.default.svc.cluster.local来定位该 Pod
- 也可以通过 DNS 服务查找域名foo.default.svc.cluster.local对应的所有 SRV 记录，获取一个 StatefulSet 所有 Pod 的信息
当 StatefulSet 管理的 Pod 消失后，会重启一个标识完全一致的 Pod 替换（不一定在同一个节点）
扩容用下一个索引值，缩容先删除最高索引值，扩/缩容都是逐步进行的（K8s 保证两个拥有相同标记和绑定相同 PVC 的有状态 Pod 不会同时运行）
- 若有不健康实例，则不允许做缩容操作（避免一次删除两个）
- 缩容只删除 Pod，保留创建的持久卷声明（PVC 被删除后，与之绑定的 PV 也会被回收或删除），需要手动删除。再扩容会重新挂载上

3. 专属存储

有状态的 Pod 存储必须是持久的，且与 Pod 解耦。即 StatefulSet 的 Pod 需要关联到不同的持久卷声明，且与独立的持久卷对应
持久卷可以预先创建，也可以由持久卷的动态供应机制实时创建

卷声明模板

StatefulSet 可以有一个或多个卷声明模板，会在创建 Pod 前创建持久卷声明，并绑定到 Pod 实例上

Kubernetes 实战——有状态应用（StatefulSet）

二、使用 StatefulSet

1. 创建

① 容器准备

docker.io/luksa/kubia-pet

POST 请求将 body 中的数据存储到 /var/data/kubia.txt
GET 请求返回主机名和存储的数据

② 手动创建存储卷

apiVersion: v1 kind: List items: - apiVersion: v1   kind: PersistentVolume   metadata:     name: pv-a  # 持久卷名称 pv-a、pv-b、pv-c   spec:     capacity:       storage: 1Mi  # 持久卷大小     accessModes:       - ReadWriteOnce     persistentVolumeReclaimPolicy: Recycle  # 卷被声明释放后，空间被回收再利用     nfs:  # 卷使用 nfs 持久磁盘。见 https://www.cnblogs.com/lb477/p/14713883.html       server: 192.168.11.210       path: "/nfs/pv-a" ...

③ 创建控制 Service

apiVersion: v1 kind: Service metadata:   name: kubia spec:   clusterIP: None  # StatefulSet 的控制 Service 必须是 headless 模式   selector:     app: kubia   ports:   - name: http     port: 80

④ 创建 StatefulSet

apiVersion: apps/v1 kind: StatefulSet metadata:   name: kubia spec:   selector:     matchLabels:       app: kubia   serviceName: kubia   replicas: 2   template:     metadata:       labels:         app: kubia     spec:       containers:       - name: kubia         image: luksa/kubia-pet         ports:         - name: http           containerPort: 8080         volumeMounts:         - name: data           mountPath: /var/data  # Pod 中的容器会把 pvc 数据卷嵌入指定目录   volumeClaimTemplates:  # 创建持久卷声明的模板，会为每个 Pod 创建并关联一个 pvc   - metadata:       name: data     spec:       resources:         requests:           storage: 1Mi       accessModes:       - ReadWriteOnce

⑤ 查看创建结果

$ kubectl get pod -w NAME      READY   STATUS              RESTARTS   AGE kubia-0   0/1     ContainerCreating   0          35s kubia-0   1/1     Running             0          53s kubia-1   0/1     Pending             0          0s kubia-1   0/1     ContainerCreating   0          3s kubia-1   1/1     Running             0          20s $ kubectl get pv NAME   CAPACITY   ACCESS MODES   RECLAIM POLICY   STATUS      CLAIM                  STORAGECLASS   REASON   AGE pv-a   1Mi        RWO            Recycle          Bound       default/data-kubia-0                           18m pv-b   1Mi        RWO            Recycle          Bound       default/data-kubia-1                           18m pv-c   1Mi        RWO            Recycle          Available                                                  18m $ kubectl get pvc NAME           STATUS   VOLUME   CAPACITY   ACCESS MODES   STORAGECLASS   AGE data-kubia-0   Bound    pv-a     1Mi        RWO                           2m3s data-kubia-1   Bound    pv-b     1Mi        RWO                           70s

2. 测试

直连 Pod 来访问：借助另一个 Pod，在其内部运行 curl 命令或使用端口转发
通过 API 服务器与 Pod 通信：API 服务器可通过代理直接连接到指定 Pod：可通过访问<apiServerHost>:<port>/api/v1/namespaces/default/pods/kubia-0/proxy/<path>请求 Pod，但 API 服务器有安全保障，需要在每次请求中添加授权令牌。因此可使用 kubectl 代理和 API 服务器代理与 Pod 通信：

$ kubectl proxy Starting to serve on 127.0.0.1:8001 $ curl localhost:8001/api/v1/namespaces/default/pods/kubia-0/proxy/ You've hit kubia-0 Data stored on this pod: No data posted yet

Kubernetes 实战——有状态应用（StatefulSet）

测试

# 1. 应用的状态独立 $ curl -X POST -d "Hello kubia-0" localhost:8001/api/v1/namespaces/default/pods/kubia-0/proxy/ Data stored on pod kubia-0 $ curl localhost:8001/api/v1/namespaces/default/pods/kubia-0/proxy/ You've hit kubia-0 Data stored on this pod: Hello kubia-0 $ curl localhost:8001/api/v1/namespaces/default/pods/kubia-1/proxy/ You've hit kubia-1 Data stored on this pod: No data posted yet  # 2. 重新启动一个完全相同的 Pod（新的 Pod 可能被调度到其他节点） $ kubectl delete pod kubia-0 pod "kubia-0" deleted $ kubectl get pod NAME      READY   STATUS              RESTARTS   AGE kubia-0   0/1     ContainerCreating   0          1s kubia-1   1/1     Running             0          106m $ curl localhost:8001/api/v1/namespaces/default/pods/kubia-0/proxy/ You've hit kubia-0 Data stored on this pod: Hello kubia-0

暴露 StatefulSet 的 Pod

# 一个常规的 ClusterIP Service，只能在集群内部访问 apiVersion: v1 kind: Service metadata:   name: kubia-public spec:   selector:     app: kubia   ports:   - port: 80     targetPort: 8080

$ curl localhost:8001/api/v1/namespaces/default/services/kubia-public/proxy/ You've hit kubia-1 / 0

3. 发现伙伴节点

SRV 记录：指向提供指定服务的服务器的主机名和端口号

获取 StatefulSet 里的所有 Pod 信息

# 运行一个名为 srvlookup 的一次性 Pod，关联控制台并在终止后立即删除 $ kubectl run -it srvlookup --image=tutum/dnsutils --rm --restart=Never -- dig SRV kubia.default.svc.cluster.local ;; ANSWER SECTION: kubia.default.svc.cluster.local. 30 IN	SRV	0 50 80 kubia-0.kubia.default.svc.cluster.local. kubia.default.svc.cluster.local. 30 IN	SRV	0 50 80 kubia-1.kubia.default.svc.cluster.local. ;; ADDITIONAL SECTION: kubia-0.kubia.default.svc.cluster.local. 30 IN A 10.244.0.15 kubia-1.kubia.default.svc.cluster.local. 30 IN A 10.244.0.16 ... # 返回的 SRV 记录顺序随机

让节点返回所有集群节点的数据

Kubernetes 实战——有状态应用（StatefulSet）

4. 处理节点失效

可通过关闭节点的 eth0 网络接口模拟节点的网络断开

当一个节点失效，运行在该节点上的 Kubelet 服务就无法与 K8s API 服务器通信，即无法汇报节点及其 Pod 的状态
StatefulSet 在明确知道一个 Pod 不再运行之前，不会创建一个替换的 Pod
一段时间后，该节点状态变为 NotReady，Pod 状态变为 Unknown
- 若节点恢复，汇报状态后 Pod 会被重新标记为 Running
- 若 Pod 的 Unknown 状态持续几分钟（可配置）后，主节点就会将 Pod 从节点驱逐（删除 Pod 资源）
  - 若此时 describe Pod，可看到其状态为 Terminating，即已经被标记为删除。但由于节点不能通信，该 Pod 仍会一直运行
- 可强制删除：kubectl delete pod kubia-0 --force --grace-period 0（除非确定节点不再运行，否则不要强制删除有状态的 Pod）

便宜好用的国外VPS推荐