Восстановление при множественных отказах диска


Сценарий таков:

  • Контроллер умирает и отключает два диска одновременно,
  • Все диски на одной scsi шине могут быть недоступны, если отказывает диск,
  • Отсоединяется кабель...
  • Коротко: довольно часто у Вас временный отказ нескольких дисков одновременно; в последствии суперблоки RAID не синхронизированы и Вы уже не можете инициализировать Ваш RAID массив.

    Остается одно: перезаписать суперблоки RAID подав mkraid --force

    Чтобы это сделать, Вам нужно иметь свежий /etc/raidtab - если он НЕ ТОЧНО соответствует устройствам и исходному порядку дисков, это не сработает.

    Посмотрите в sylog на результат попытки запуска массива, Вы увидите отсчет событий для каждого суперблока; обычно лучше оставить диск с наименьшим отсчетом события, т.е. с самым старым.

    Если Вы делаете mkraid без failed-disk, нить восстановления немедленно выругается и начнет перестроение блоков паритета - не то, что Вам сейчас нужно.

    С failed-disk, В можете точно указать какие диски Вы хотите активировать и, возможно, попробовать различные комбинации для лучшего результата. Подсказка, при этих экспериментах монтируете систему в режиме только для чтения... Это было успешно использовано, по крайней мере, двумя парнями, с которыми я контактировал.



    Содержание раздела