Сабж предыдущего сообщения подходит под очень многие ситуации в сисадминстве. И хорошо, если факап случился не у тебя.
По наводке отсюда нашел интересную информацию (ключевые моменты я выделю):
12 сентября ночью в нашем датацентре произошел серьезный сбой, при котором одна из систем хранения, которая содержала в себе изображения за последние 1.5 года вышла из строя.
В своей работе мы используем многодисковые системы хранения со встроенными raid-массивами, которые гарантируют сохранность данных в случае выхода из строя одного из дисков. Это оптимальное решение, которое лежит в основе всех крупнейших сайтов.
К сожалению, сегодня ночью из строя вышли сразу два диска. Как результат, массив хранения отключился из-за вероятности полного повреждения данных.
Ближайщие дни будут посвящены плотному анализу и мы приложим все усилия к их восстановлению. Мы предпримем любые необходимые действия, вплоть до отправки массива на анализ производителю, находящемуся в другой стране.
...
19 сентября 09:00 Все оставшиеся хранилища переведены в режим Raid 6, гарантирующий более высокую степень защиты. Новостей от центра восстановления данных пока нет.
Источник.
С одной стороны, всегда жаль коллег, попавших в подобную ситуацию. С другой, есть повод внимательно изучить негативный опыт других.
К сожалению, нашу наивность и расчет на то, что "дорогая система и работать будет хорошо и надежно" легко приводит к подобным ситуациям. Однако даже дорогая система требует внимания к обеспечению сохранности данных. Сбои случаются у любых систем. И очень важно правильно сконфигурировать систему.
Как уже рассказывал
коллега romx, raid-5 представляет достаточно опасную с т.з. надежности данных конфигурацию. Естественно, если в массиве 4 диска, то подобные соображения носят довольно умозрительный характер. Но с ростом числа дисков - что и происходит в серверах, дисковых полках и системах хранения данных, - надежность raid-5 становится неприемлемо низкой.
Очевидно, что в вышеприведенном случае админы не уделили внимания теоретически, казалось бы, маловероятному событию - выходу из строя двух дисков массива. Возможно, сказалась упомянутая выше "магия цены" и опыт работы с малыми массивами, где Raid-5 достаточен.
Итог: для хранения важных данных raid-5 не рекомендуется, желательно использовать raid-6 или raid-10.
