Получение списка проблемных дисков.

Контролеры 3ware никак не контролируют SMART регистры дисков из массива. Поэтому появление неустранимого сбойного сектора может оказаться весьма неожиданным для владельца. Для меня было неожиданным увидеть 256 премещённых секторов. в одном из дисков. После проверки всех дисков всех серверов одного кластера оказалось что 5 дисков из 40-ка уже “поплыли”, причём в одном зеркале поплыли оба диска. Проверять массу дисков вручную накладно. Поэтому предлагаю вот такой скрипт:

for i in `seq 0 15`; do echo Disc $i; smartctl -d 3ware,$i -A /dev/twa0|grep -E "(Reallocated_Sector_Ct|Current_Pending_Sector)"; done

Здесь /dev/twa0 – устройство отображаемое в систему контроллером 3ware. Может быть twaX или tweX.

Немножко изменил и вот что вышло:
# for i in `seq 0 15`; do echo -----==== Disc $i ====-----; smartctl -d 3ware,$i -i /dev/twa0|grep -E "(Serial|Firmware)"; smartctl -d 3ware,$i -A /dev/twa0|grep -E "(Reallocated_Sector_Ct|Current_Pending_Sector)"|awk '{ print $2": "$10 }'; done
-----==== Disc 0 ====-----
Serial Number: 9QJ2K5A4
Firmware Version: BN06
Reallocated_Sector_Ct: 0
Current_Pending_Sector: 0
-----==== Disc 1 ====-----
Serial Number: 9QJ4DB7C
Firmware Version: BN06
Reallocated_Sector_Ct: 0
Current_Pending_Sector: 0
-----==== Disc 2 ====-----
Serial Number: 9QJ64WS6
Firmware Version: BN06
Reallocated_Sector_Ct: 0
Current_Pending_Sector: 0
-----==== Disc 3 ====-----
Serial Number: 9QJ715VR
Firmware Version: BN06
Reallocated_Sector_Ct: 0
Current_Pending_Sector: 0
-----==== Disc 4 ====-----
Serial Number: 9QJ35GE8
Firmware Version: BN06
Reallocated_Sector_Ct: 0
Current_Pending_Sector: 0
-----==== Disc 5 ====-----
Serial Number: 9QJ4DF2T
Firmware Version: BN06
Reallocated_Sector_Ct: 0
Current_Pending_Sector: 0
-----==== Disc 6 ====-----
Serial Number: 9QJ727F8
Firmware Version: SN06
Reallocated_Sector_Ct: 0
Current_Pending_Sector: 0
-----==== Disc 7 ====-----
Serial Number: 9QJ4DC4A
Firmware Version: BN06
Reallocated_Sector_Ct: 0
Current_Pending_Sector: 0
-----==== Disc 8 ====-----
Serial Number: 9QJ307QG
Firmware Version: BN06
Reallocated_Sector_Ct: 0
Current_Pending_Sector: 0
-----==== Disc 9 ====-----
Serial Number: 9QJ6XBJM
Firmware Version: BN06
Reallocated_Sector_Ct: 0
Current_Pending_Sector: 0
-----==== Disc 10 ====-----
Serial Number: 9QJ4AHDX
Firmware Version: BN06
Reallocated_Sector_Ct: 0
Current_Pending_Sector: 0
-----==== Disc 11 ====-----
Serial Number: 9QJ71V77
Firmware Version: BN06
Reallocated_Sector_Ct: 0
Current_Pending_Sector: 0
-----==== Disc 12 ====-----
Serial Number: 9QJ36GDK
Firmware Version: BN06
Reallocated_Sector_Ct: 0
Current_Pending_Sector: 0
-----==== Disc 13 ====-----
Serial Number: 9QJ6YB9H
Firmware Version: BN06
Reallocated_Sector_Ct: 0
Current_Pending_Sector: 0
-----==== Disc 14 ====-----
Serial Number: 9QJ62GAH
Firmware Version: BN06
Reallocated_Sector_Ct: 0
Current_Pending_Sector: 0
-----==== Disc 15 ====-----
Serial Number: 9QJ77R8F
Firmware Version: SN06
Reallocated_Sector_Ct: 0
Current_Pending_Sector: 0

Добавлю о маркировке дисков.
Сначала я клеил наклейки с номерами дисков. Потом, когда после сборки массива переставлял все диски таким образом чтобы разные диски зеркала оказались на разных линиях питания я понял одну вещь: метить диски наклейками на конзинках глупо. Когда серверов становится больше одного и имеются запасные корзинки для установки дисков перед быстрой заменой сбойных, проще искать нужные диски не по их номеру в конзине, а по зажжённой лампочке при помощи i2c мультиплексора и по серийному номеру диска, часть которого у дисков seagate обычно видна через вентиляционные отверствия корзинки.

Leave a Reply