Произошла неудачная попытка резервного копирования. Попытка снять снимок состояния (снапшот) программой резервного копирования застряла на 89% и в таком состоянии пробыла более восьми часов. После прерывания этого процесса машина перестала загружаться. Машина была не критична для деятельности компании.
В vCenter так же более восьми часов наблюдался процесс снятия снимка машины на 89%. Одновременно с этим был процесс SDRS на эту же машину. В программе резервного копирования тоже была задача копирования снимков виртуальных машин. Все эти процессы не прерывались стандартными методами и никак не реагировали.
Как починил:
- Включил SSH сервис на нужном гипервизоре. Подключился терминалом.
- Подключаемся терминальным клиентом, например putty, к серверу.
- Выполняем команду: kill 13089289 Эта команда завершит процесс выполнения виртуальной машины.
- Теперь все задачи перечисленные выше остановлены с ошибками. Значит можно разбираться с виртуальной машиной и последствиями сбоя.
В данном конкретном случае я решил восстановить виртуальную машины из прошлой работающей резервной копии.