我有一個 3 節點 ubuntu 20.04 lts - kvm - kubernetes 集群,kvm-host 也是 ubuntu 20.04 lts。我在 kvm-host 上運行了劇本。我有以下庫存摘錄:
nodes:
hosts:
sea_r:
ansible_host: 192.168.122.60
spring_r:
ansible_host: 192.168.122.92
island_r:
ansible_host: 192.168.122.93
vars:
ansible_user: root
并且一直在嘗試很多async_status,但總是失敗,
- name: root commands
hosts: nodes
tasks:
- name: bash commands
ansible.builtin.shell: |
apt update
args:
chdir: /root
executable: /bin/bash
async: 2000
poll: 2
register: output
- name: check progress
ansible.builtin.async_status:
jid: "{{ output.ansible_job_id }}"
register: job_result
until: job_result.finished
retries: 200
delay: 5
有錯誤:
fatal: [sea_r]: FAILED! => {"msg": "The task
includes an option with an undefined variable.
The error was: 'dict object' has no attribute
'ansible_job_id' ...
相反,如果我嘗試以下方法,
- name: root commands
hosts: nodes
tasks:
- name: bash commands
ansible.builtin.shell: |
apt update
args:
chdir: /root
executable: /bin/bash
async: 2000
poll: 2
register: output
- debug: msg="{{ output.stdout_lines }}"
- debug: msg="{{ output.stderr_lines }}"
我沒有錯誤。還嘗試了以下變化,
- name: check progress
ansible.builtin.async_status:
jid: "{{ item.ansible_job_id }}"
with_items: "{{ output }}"
register: job_result
until: job_result.finished
retries: 200
delay: 5
這被建議作為類似錯誤的解決方案。這也無濟于事,我只是得到略有不同的錯誤:
fatal: [sea_r]: FAILED! => {"msg": "The task includes
an option with an undefined variable. The error
was: 'ansible.utils.unsafe_proxy.AnsibleUnsafeText
object' has no attribute 'ansible_job_id' ...
在劇本的開頭和結尾,我恢復并暫停了我的 3 個 kvm 服務器節點,如下所示:
- name: resume vms
hosts: local_vm_ctl
tasks:
- name: resume vm servers
shell: |
virsh resume kub3
virsh resume kub2
virsh resume kub1
virsh list --state-paused --state-running
args:
chdir: /home/bi
executable: /bin/bash
environment:
LIBVIRT_DEFAULT_URI: qemu:///system
register: output
- debug: msg="{{ output.stdout_lines }}"
- debug: msg="{{ output.stderr_lines }}"
所以
- name: pause vms
hosts: local_vm_ctl
tasks:
- name: suspend vm servers
shell: |
virsh suspend kub3
virsh suspend kub2
virsh suspend kub1
virsh list --state-paused --state-running
args:
chdir: /home/bi
executable: /bin/bash
environment:
LIBVIRT_DEFAULT_URI: qemu:///system
register: output
- debug: msg="{{ output.stdout_lines }}"
- debug: msg="{{ output.stderr_lines }}"
但我不明白這些戲劇與所說的錯誤有什么關系。
任何幫助都感激不盡。
uj5u.com熱心網友回復:
您的作業 ID 出現未定義錯誤,因為:
- 您
poll: X在初始任務中使用,因此 ansible 每 X 秒連接一次以檢查任務是否完成 - 當 ansible 存在那個任務并進入你的下一個
async_status任務時,作業就完成了。并且由于您poll對異步狀態快取使用了非零值,因此會自動清除。 - 由于快取被清除,作業 ID 不再存在。
您的上述方案旨在用于避免目標在長時間運行的任務上超時,而不是同時運行任務并在其狀態上有一個稍后的檢查點。對于第二個要求,您需要自己運行異步任務poll: 0并清理快取
有關上述概念的更多說明,請參閱檔案:
- ansible 異步指南
- ansible
async_status模塊
我為您的上述任務制作了一個示例,并將其修復為使用專用模塊apt(請注意,您可以name使用一個或一系列軟體包向模塊添加一個選項,并且 ansible 將在一個步驟中完成快取更新和安裝)。此外,如果您想確保不會錯過結束,retries * delay則 async_status 任務應等于或大于async初始任務。
- name: Update apt cache
ansible.builtin.apt:
update_cache: true
async: 2000
poll: 0
register: output
- name: check progress
ansible.builtin.async_status:
jid: "{{ output.ansible_job_id }}"
register: job_result
until: job_result.finished
retries: 400
delay: 5
- name: clean async job cache
ansible.builtin.async_status:
jid: "{{ output.ansible_job_id }}"
mode: cleanup
這對于并行啟動一堆持久任務更有用。這是一個無用但實用的示例:
- name: launch some loooooong tasks
shell: "{{ item }}"
loop:
- sleep 30
- sleep 20
- sleep 35
async: 100
poll: 0
register: long_cmd
- name: wait until all commands are done
async_status:
jid: "{{ item.ansible_job_id }}"
register: async_poll_result
until: async_poll_result.finished
retries: 50
delay: 2
loop: "{{ long_cmd.results }}"
- name: clean async job cache
async_status:
jid: "{{ item.ansible_job_id }}"
mode: cleanup
loop: "{{ long_cmd.results }}"
uj5u.com熱心網友回復:
你有poll: 2你的任務,它告訴 Ansible 每 2 秒在內部輪詢一次異步作業,并在注冊變數中回傳最終狀態。為了使用,async_status您應該設定poll: 0使任務不等待作業完成。
轉載請註明出處,本文鏈接:https://www.uj5u.com/net/409466.html
標籤:
上一篇:使用輸入選擇變數
