- A+
一 引言
前段时间自己实现了ansible对接操作系统升级脚本,现将整个项目记录如下,如果项目中存在问题或优化的点,请帮忙指正。本项目运行在RedHat Linux系统。
在我们生产环境中,操作系统的升级由系统升级、服务器重启以及vmtools安装三部分组成。本次项目的目标有两点:
(1) ansible对接操作系统升级脚本实现自动批量升级服务器系统。
(2) 系统升级、服务器重启和vmtools安装三部分即可以统一运行又可各部分独立运行。
存在的难点:在实现中,如何实现服务器重启部分和其余两个部分的衔接。这里需要考虑以下几点:
(1) 如何判断服务器是否需要重启?
(2) 如何判断服务器是否重启成功?
(3) 如何避免服务器重启过程中ansible会话的断开?
具体的实现过程以及难点解决方法将在后续的项目介绍中展示。
二 项目介绍
图1 项目中playbook的运行流程
在项目中我们创建一个单独的ansible角色,角色名为update_os。整个ansible角色分为检测任务、主机升级任务、重启任务、vmtools安装任务。各任务的功能如下:
- 检测任务: 判断主机是否在线。
- 主机升级任务: 升级操作系统、记录升级日志、判断升级是否成功。
- 重启任务: 判断主机是否升级成功、重启服务器、判读主机重启是否成功。
- vmtools安装任务: 安装vmtools、记录安装日志、判断是否安装成功。
各个playbook的内容:
site.yml文件是updata_os角色的入口,使用roles导入update_so角色。
--- - name: update os gather_facts: no hosts: test roles: - update_os
update_os角色的tasks目录中的文件有main.yml、ping.yml、 update.yml、reboot.yml、install_vmtools.yml五个playbook文件。
main.yml文件的内容如下:
--- - name: check if host is online include: ping.yml tags: always - name: Start system upgrade block: - name: decide to proceed setup: tags: always - name: include update playbook include_tasks: file: update.yml apply: tags: update_os tags: always - name: include reboot playbook include_tasks: file: reboot.yml apply: tags: reboot_singal tags: always - name: include vmtools playbook include_tasks: file: install_vmtools.yml apply: tags: vmtools tags: always when: > ( ping.failed is defined and ping.failed == false ) or ( ping2.failed is defined and ping2.failed == false )
main.yml文件中实现对其余四个playbook文件的调用。在main.yml文件中先导入ping.yml文件来检测在线的主机,之后只对在线的主机执行block块(Start system upgrade)中的内容。main.yml文件中之后依次导入update.yml, reboot.yml和install_vmtools.yml三个playbook。main.yml文件中也使用了ansible的tags功能,这样可以实现主机升级、重启、安装vmtools三个任务既可以单个执行又可以统一执行,适用于多种场景的使用。例如:
]# ansible-playbook site.yml # 统一执行 ]# ansible-playbook site.yml --tags update_os #只执行标签update_os即主机升级任务
ping.yml文件内容如下:
--- - name: test if linux is alive block: - name: 1st ping linux ping: register: ping failed_when: false ignore_unreachable: yes ignore_errors: yes - name: 2nd ping linux ping: register: ping2 failed_when: false ignore_unreachable: yes ignore_errors: yes when: > (ping.failed is defined and ping.failed == true) or (ping.unreachable is defined and ping.unreacheable == true) when: (ansible_connection is defined) and ((ansible_connection == 'ssh') or (ansible_connection == ''))
ping.yml文件的编写机制为: 第一次对受控主机执行ansible的ping模块,并使用register记录结果。 对于第一次ping失败时的主机,playbook将执行第二次ping。第二次ping的原因是为了避免网络抖动等因素导致第一次ping失败。只有第一次或第二次ping成功的受控主机才进行之后的任务。
三 参考文献
- https://github.com/skippie81/ansible-os-update
- https://github.com/D34m0nN0n3/ansible-update-os
- https://github.com/joe-speedboat/ansible.os_update