Методика тестирования СХД. Физика. Часть 1.

Эта запись открывает серию постов про тестирование СХД. Как оказалось, в РУ-сегменте, нет нормального документа-подсказки или методологии тестирования систем хранения. Вот представьте, вам надо купить СХД, вокруг много вендоров, плюс импортозамещение. Но все привыкли либо к обычным NAS, либо хранят на локальных дисках, либо связывались с именитыми брендами и знать не знали о проблемах, которые могут возникнуть.
Однако, к сожалению, у каждой системы есть свои приколы, у одних больше, у других меньше. Но как отсеять полный треш? Как обезопасить себя на конкурсах или при покупке себе на фирму? Как не потерять данные при простой операции? Об этом и поговорим.

В нашем уютном телеграм-чатике было принято решение, о том, что нам нужна методичка. Рыбу документа собирал товарищ у себя тут. Полный набор ссылок по теме тестирования здесь.

Тестирование основных физических компонентов

Для начала займемся расстановкой точек над некоторыми фундаментальными i. © Макс Фрай

  • Где хранится ОС? Если на дисках, то на каких?
  • Используются ли диски СХД для хранения копии ОС и логов и данных?
  • Какая модель используется? Active/Passive, ALUA (Asymmetric Logical Unit Access) или SAA (Symmetrical Active/Active)?
  • Сколько времени идет переключение путей при отказе или замене контроллера? Есть ли ограничения и какие?
  • Есть ли оценка уровня сигнала SFP?
  • Как работает система от переменного тока 220/230 50/60, в каком диапазоне?
  • Как работает система от постоянного тока?
  • Сколько времени система работает на одном блоке питания?
  • Сколько времени дается на замену блока питания? Некоторые СХД при замене блоков питания требуют провести замену за не более чем 5 минут после выдергивания старого.
  • Сколько времени дается на замену контроллера?
  • Сколько батарей установлено в СХД и есть ли их встроенное тестирование? Как оно обрабатывается?
  • Может ли СХД одновременно работать с разными типами SFP, например, Ethernet 10G и FC8 ?
  • Сам запуск системы. Запустилась ли с первого раза, сколько занимает запуск из коробки? Описаны ли процедуры запуска и выключения?
  • Подключение к Vmware и Hyper-V. Без проблем ли (особенно с iSCSI security), или надо что-то крутить?
  • LUN Security.
  • Есть ли настройки презентации LUN для отдельных инициаторов, группами и иначе? Masking?
  • Есть ли конвертация на лету из R5 в R6, R1 в R10 и тд.?
  • Есть ли ограничения на количество элементов в группах, в частности во сколько групп может быть включен и LUN, и инициатор
  • Операции при первичном запуске «из коробки» — форматирование дисков и прочие внутренние операции. Сколько занимают?
  • Как система обрабатывает выдергивание кабеля питания из блока питания?
  • Как система обрабатывает выключение питания из PDU?
  • Как система отрабатывает пропадание питание «от щитка»?
  • Замена блока питания. Заведется ли при замене или надо будет оба выключать?
  • Как система отрабатывает выдергивание 4 случайных SFP модулей под нагрузками вида файловое чтение, запись, СУБД?
  • Как система отрабатывает выдергивание контроллера 1?(Подразумевается, что MPIO настроен и работает и нагрузка видна в RR режиме)
  • Как система отрабатывает его возврат и балансировку?Примечание: вопрос взят по результатам тестов infortrend-gs, с описанием ситуации: Затем мы вернули контроллер А на место и примерно через 2 минуты массив стал полностью недоступен. При этом статус массива был в состоянии Shutdown.
  • Как система отрабатывает выдергивание второго контроллера и его возвращение? А если по схеме 2-1-2-1 ?
  • Сколько и как идет ребилд?
  • Можно ли управлять скоростью (приоритетом) ребилда?
  • Если выдернули НЕ ТОТ диск, сколько времени есть для того, чтобы его вставить обратно без ребилда?
  • Что вообще будет если вынуть диск и поставить обратно — поймет ли СХД что это тот же диск, нужно ли будет вручную сказать «ну ты там это посмотри» или пойдет ребилд, а диск надо будет вручную очистить и только потом ставить обратно или как?
  • Что будет с системой, если выдернуть диски с ОС?
  • Что будет с системой, если дернуть целиком дополнительную полку? Ну вот было у нас так, включено по питанию по ошибке в один PSU, что упала по питанию полка, что будет?

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *