Western Digital HDD + RAID + Drive timeout

Есть у нас сторадж сервера в которых установлены 1TB диски Seagate Barracuda ES.2 ST31000340NS. Эти диски вставлены в RAID контроллеры 3Ware. Средний возраст дисков 3,7 лет. Около 40% дисков вышли из строя в течение гарантийного срока и были заменены продавцом на Certified repaired HDD. Все эти заменённые диски тоже вышли из сроя после окончания гарантийного срока и с ними умерло ещё 10% дисков. В сумме на сегодняшний день умерло около 50% дисков от общего количества установленного в стораджах. Расстроившись от качества дисков Seagate и исчерпав ремкомплект из таких же дисков мы решили попробовать другие диски. Взяли не Enterprise диски Western Digital WD10EZEX-00RKKA0. Дней через 10 диски начали непонятным образом «вываливаться» из массива перевода его в деградированное состояние. В логах серверов где стояли эти диски была примерно сходная ситуация.
Continue reading Western Digital HDD + RAID + Drive timeout

Получение списка проблемных дисков.

Контролеры 3ware никак не контролируют SMART регистры дисков из массива. Поэтому появление неустранимого сбойного сектора может оказаться весьма неожиданным для владельца. Для меня было неожиданным увидеть 256 премещённых секторов. в одном из дисков. После проверки всех дисков всех серверов одного кластера оказалось что 5 дисков из 40-ка уже “поплыли”, причём в одном зеркале поплыли оба диска. Проверять массу дисков вручную накладно. Поэтому предлагаю вот такой скрипт:
Continue reading Получение списка проблемных дисков.

3ware i2c multiplexer

В RAID массиве больше чем 2 диска для их горячей замены нужно точно знать что вытягивать. Ситуация осложняется и тем что при создании массива контроллер почему-то “раскидывает” диски как ему хочется. Тоесть физическое подключение диска не соответствует логическому логическому номеру в массиве. Компания 3ware выпустила i2c мультиплексор который в паре с (в моём случае корпусом Supermicro SC836TQ) даёт возможность зажигать лампочки на выбраных дисках.
Continue reading 3ware i2c multiplexer

Обновление 3ware 9650SE-2LP до предыдущей версии.

После переписки выяснилось что отсутствие проблемм на тестовой машине у саппорта Supermicro связано с старой версией прошивки 3ware.
Их контроллер:
BIOS Version: BE9X 3.08.00.004
FW Version: FE9X 3.08.00.016

Мои контроллеры:
BIOS Version: BE9X 4.05.00.015
FW Version: FE9X 4.06.00.004
Чтобы сейчас, пока они будут фиксить свой BIOS, можно было пользоваться серверами я понизил версию BIOS.
Continue reading Обновление 3ware 9650SE-2LP до предыдущей версии.

Delock IDE->SATA & SATA->IDE конвертер

При установке серверной матери в 3U корпус столкнулся с проблемой: на материнской плате отсутствовал IDE контроллер для подключения IDE CD-ROM-а установленного в корпусе. Материнская плата – не родная для данного корпуса, и это не единственная из несовместимостей, никак не влияющих на функционирование системы. Отсутствие IDE на материнской исключало возможность использования CDROM.
Continue reading Delock IDE->SATA & SATA->IDE конвертер