Методика тестирования СХД. Физика. Часть 1.
Эта запись открывает серию постов про тестирование СХД. Как оказалось, в РУ-сегменте, нет нормального документа-подсказки или методологии тестирования систем хранения. Вот представьте, вам надо купить СХД, вокруг много вендоров, плюс импортозамещение. Но все привыкли либо к обычным NAS, либо хранят на локальных дисках, либо связывались с именитыми брендами и знать не знали о проблемах, которые могут возникнуть.
Однако, к сожалению, у каждой системы есть свои приколы, у одних больше, у других меньше. Но как отсеять полный треш? Как обезопасить себя на конкурсах или при покупке себе на фирму? Как не потерять данные при простой операции? Об этом и поговорим.
В нашем уютном телеграм-чатике было принято решение, о том, что нам нужна методичка. Рыбу документа собирал товарищ у себя тут. Полный набор ссылок по теме тестирования здесь.
Тестирование основных физических компонентов
Для начала займемся расстановкой точек над некоторыми фундаментальными i. © Макс Фрай
- Где хранится ОС? Если на дисках, то на каких?
- Используются ли диски СХД для хранения копии ОС и логов и данных?
- Какая модель используется? Active/Passive, ALUA (Asymmetric Logical Unit Access) или SAA (Symmetrical Active/Active)?
- Сколько времени идет переключение путей при отказе или замене контроллера? Есть ли ограничения и какие?
- Есть ли оценка уровня сигнала SFP?
- Как работает система от переменного тока 220/230 50/60, в каком диапазоне?
- Как работает система от постоянного тока?
- Сколько времени система работает на одном блоке питания?
- Сколько времени дается на замену блока питания? Некоторые СХД при замене блоков питания требуют провести замену за не более чем 5 минут после выдергивания старого.
- Сколько времени дается на замену контроллера?
- Сколько батарей установлено в СХД и есть ли их встроенное тестирование? Как оно обрабатывается?
- Может ли СХД одновременно работать с разными типами SFP, например, Ethernet 10G и FC8 ?
- Сам запуск системы. Запустилась ли с первого раза, сколько занимает запуск из коробки? Описаны ли процедуры запуска и выключения?
- Подключение к Vmware и Hyper-V. Без проблем ли (особенно с iSCSI security), или надо что-то крутить?
- LUN Security.
- Есть ли настройки презентации LUN для отдельных инициаторов, группами и иначе? Masking?
- Есть ли конвертация на лету из R5 в R6, R1 в R10 и тд.?
- Есть ли ограничения на количество элементов в группах, в частности во сколько групп может быть включен и LUN, и инициатор
- Операции при первичном запуске «из коробки» — форматирование дисков и прочие внутренние операции. Сколько занимают?
- Как система обрабатывает выдергивание кабеля питания из блока питания?
- Как система обрабатывает выключение питания из PDU?
- Как система отрабатывает пропадание питание «от щитка»?
- Замена блока питания. Заведется ли при замене или надо будет оба выключать?
- Как система отрабатывает выдергивание 4 случайных SFP модулей под нагрузками вида файловое чтение, запись, СУБД?
- Как система отрабатывает выдергивание контроллера 1?(Подразумевается, что MPIO настроен и работает и нагрузка видна в RR режиме)
- Как система отрабатывает его возврат и балансировку?Примечание: вопрос взят по результатам тестов infortrend-gs, с описанием ситуации: Затем мы вернули контроллер А на место и примерно через 2 минуты массив стал полностью недоступен. При этом статус массива был в состоянии Shutdown.
- Как система отрабатывает выдергивание второго контроллера и его возвращение? А если по схеме 2-1-2-1 ?
- Сколько и как идет ребилд?
- Можно ли управлять скоростью (приоритетом) ребилда?
- Если выдернули НЕ ТОТ диск, сколько времени есть для того, чтобы его вставить обратно без ребилда?
- Что вообще будет если вынуть диск и поставить обратно — поймет ли СХД что это тот же диск, нужно ли будет вручную сказать «ну ты там это посмотри» или пойдет ребилд, а диск надо будет вручную очистить и только потом ставить обратно или как?
- Что будет с системой, если выдернуть диски с ОС?
- Что будет с системой, если дернуть целиком дополнительную полку? Ну вот было у нас так, включено по питанию по ошибке в один PSU, что упала по питанию полка, что будет?