docker 应用-4(swarm模式搭建集群)

时间:2023-03-09 00:54:26
docker 应用-4(swarm模式搭建集群)

swam模式

使用docker的swarm模式,可以很方便的搭建docker engine集群。docker engine是docker 容器的运行时环境,可以在docker engine上build和run 容器,一台机器(物理或虚拟机)上只有一套docker engine,一个docker engine上可以运行多个docker容器。swarm可以让多台机器(物理或虚拟机)的docker engine构成集群。

node,service,task

node是加入到swarm集群中的一个docker引擎实体,可以在一台物理机上运行多个node,node分为manager nodes和worker nodes,manager node进行管理,但在默认情况下也会像worker node一样运行task。
    service是运行在worker nodes上的task的描述,service的描述包括使用哪个docker 镜像,以及在使用该镜像的容器中执行什么命令。
    task是service的执行实体,task 启动docker容器并在容器中执行任务。

使用

1. 启动swarm集群
#docker swam init --advertise-addr 192.168.2.10
Swarm initialized: current node (lm24azn2ptgasi9ov3121k6yw) is now a manager.
To add a worker to this swarm, run the following command: docker swarm join \
--token SWMTKN-1-5fli7xt3s4hbt3pghkmaosgz98ttvmnd1t5lolnkfn446s6gpj-15893cufutsyuc7ewg89iwhz3 \
192.168.2.10:2377

主机 192.168.2.10作为manager machine, 创建完之后,该机器自动加入到swarm集群。通过docker info可以查看。

2. 加入新机器到集群

在docker swarm init 完了之后,会提示如何加入新机器到集群,如果当时没有注意到,也可以通过下面的命令来获知 如何加入新机器到集群。

[skc@dev-11 ubt14-hadoop-hbase]$ docker swarm join-token worker
To add a worker to this swarm, run the following command: docker swarm join \
--token SWMTKN-1-5fli7xt3s4hbt3pghkmaosgz98ttvmnd1t5lolnkfn446s6gpj-15893cufutsyuc7ewg89iwhz3 \
192.168.2.10:2377

然后在另外机器上执行

docker swarm join \
--token SWMTKN-1-5fli7xt3s4hbt3pghkmaosgz98ttvmnd1t5lolnkfn446s6gpj-15893cufutsyuc7ewg89iwhz3 \
192.168.2.10:2377

使机器加入集群。

然后在manager machine上执行 docker node ls 查看有哪些节点加入到swarm集群。

[skc@dev-11 ubt14-hadoop-hbase]$ docker node ls
ID HOSTNAME STATUS AVAILABILITY MANAGER STATUS
ei5cfav0zorx41rc41fq3yda6 dev-12 Ready Active
gsquovn98ncoxfcupj8haj61e dev-13 Ready Active
lm24azn2ptgasi9ov3121k6yw * dev-11 Ready Active Leader
3. 向集群中部署service

在swarm集群中部署service只能在manager machine
上进行操作。
3.1 创建

[skc@dev-11 ubt14-hadoop-hbase]$ docker service create --replicas 1 --name helloworld alpine ping docker.com
u0p8d9j0p8x2bbv9e8w43ztfp 其中, --name 指定了service的名称; --replicas 指定了需要几个task同时运行;
alpine ping docker.com 是使用alpine容器执行ping docker.com 的命令。

3.2 查看信息
    使用docker service inspect --pretty helloworld 来查看service的信息。
    使用docker service ps helloworld 来查看helloworld的服务在哪个节点上运行。

[skc@dev-11 ubt14-hadoop-hbase]$ docker service ps helloworld
ID NAME IMAGE NODE DESIRED STATE CURRENT STATE ERROR PORTS
hx9lqu9ksq1v helloworld.1 alpine:latest dev-12 Running Running about a minute ago
mejq6j42ozv0 \_ helloworld.1 alpine:latest dev-11 Shutdown Failed about a minute ago "task: non-zero exit (1)"

上图中出现两个task,原因是之前在dev-11上执行命令使task挂掉了,swarm自动在dev-12上新启动了一个task。此时在 dev-12上执行 docker ps,可以看到有容器正在运行。

[skc@dev-12 ~]$ docker ps
CONTAINER ID IMAGE COMMAND CREATED STATUS PORTS NAMES
9a075e16a7dd alpine@sha256:dfbd4a3a8ebca874ebd2474f044a0b33600d4523d03b0df76e5c5986cb02d7e8 "ping docker.com" About a minute ago Up About a minute helloworld.1.hx9lqu9ksq1vp9dfx2hs0dlk8

3.3 修改service的task个数
$ docker service scale <SERVICE-ID>=<NUMBER-OF-TASKS>

[skc@dev-11 ubt14-hadoop-hbase]$ docker service scale helloworld=2
helloworld scaled to 2
[skc@dev-11 ubt14-hadoop-hbase]$ docker service ps helloworld
ID NAME IMAGE NODE DESIRED STATE CURRENT STATE ERROR PORTS
hx9lqu9ksq1v helloworld.1 alpine:latest dev-12 Running Running 10 minutes ago
mejq6j42ozv0 \_ helloworld.1 alpine:latest dev-11 Shutdown Failed 10 minutes ago "task: non-zero exit (1)"
0kxu1cqetga0 helloworld.2 alpine:latest dev-11 Running Running 8 seconds ago

3.4 删除service
docker service rm helloworld

3.5 更改节点的availablity状态
    swarm集群中node的availability状态可以为

active或者drain。其中active状态下,node可以接受来自manager节点的任务分派;而drain状态下,node节点会结束task,且不再接受来自manager节点的任务分派。
$ docker node update --availability drain worker1
$ docker node update --availability active worker1