Контролеры 3ware никак не контролируют SMART регистры дисков из массива. Поэтому появление неустранимого сбойного сектора может оказаться весьма неожиданным для владельца. Для меня было неожиданным увидеть 256 премещённых секторов. в одном из дисков. После проверки всех дисков всех серверов одного кластера оказалось что 5 дисков из 40-ка уже “поплыли”, причём в одном зеркале поплыли оба диска. Проверять массу дисков вручную накладно. Поэтому предлагаю вот такой скрипт:
for i in `seq 0 15`; do echo Disc $i; smartctl -d 3ware,$i -A /dev/twa0|grep -E "(Reallocated_Sector_Ct|Current_Pending_Sector)"; done
Здесь /dev/twa0 – устройство отображаемое в систему контроллером 3ware. Может быть twaX или tweX.
Немножко изменил и вот что вышло:
# for i in `seq 0 15`; do echo -----==== Disc $i ====-----; smartctl -d 3ware,$i -i /dev/twa0|grep -E "(Serial|Firmware)"; smartctl -d 3ware,$i -A /dev/twa0|grep -E "(Reallocated_Sector_Ct|Current_Pending_Sector)"|awk '{ print $2": "$10 }'; done
-----==== Disc 0 ====-----
Serial Number: 9QJ2K5A4
Firmware Version: BN06
Reallocated_Sector_Ct: 0
Current_Pending_Sector: 0
-----==== Disc 1 ====-----
Serial Number: 9QJ4DB7C
Firmware Version: BN06
Reallocated_Sector_Ct: 0
Current_Pending_Sector: 0
-----==== Disc 2 ====-----
Serial Number: 9QJ64WS6
Firmware Version: BN06
Reallocated_Sector_Ct: 0
Current_Pending_Sector: 0
-----==== Disc 3 ====-----
Serial Number: 9QJ715VR
Firmware Version: BN06
Reallocated_Sector_Ct: 0
Current_Pending_Sector: 0
-----==== Disc 4 ====-----
Serial Number: 9QJ35GE8
Firmware Version: BN06
Reallocated_Sector_Ct: 0
Current_Pending_Sector: 0
-----==== Disc 5 ====-----
Serial Number: 9QJ4DF2T
Firmware Version: BN06
Reallocated_Sector_Ct: 0
Current_Pending_Sector: 0
-----==== Disc 6 ====-----
Serial Number: 9QJ727F8
Firmware Version: SN06
Reallocated_Sector_Ct: 0
Current_Pending_Sector: 0
-----==== Disc 7 ====-----
Serial Number: 9QJ4DC4A
Firmware Version: BN06
Reallocated_Sector_Ct: 0
Current_Pending_Sector: 0
-----==== Disc 8 ====-----
Serial Number: 9QJ307QG
Firmware Version: BN06
Reallocated_Sector_Ct: 0
Current_Pending_Sector: 0
-----==== Disc 9 ====-----
Serial Number: 9QJ6XBJM
Firmware Version: BN06
Reallocated_Sector_Ct: 0
Current_Pending_Sector: 0
-----==== Disc 10 ====-----
Serial Number: 9QJ4AHDX
Firmware Version: BN06
Reallocated_Sector_Ct: 0
Current_Pending_Sector: 0
-----==== Disc 11 ====-----
Serial Number: 9QJ71V77
Firmware Version: BN06
Reallocated_Sector_Ct: 0
Current_Pending_Sector: 0
-----==== Disc 12 ====-----
Serial Number: 9QJ36GDK
Firmware Version: BN06
Reallocated_Sector_Ct: 0
Current_Pending_Sector: 0
-----==== Disc 13 ====-----
Serial Number: 9QJ6YB9H
Firmware Version: BN06
Reallocated_Sector_Ct: 0
Current_Pending_Sector: 0
-----==== Disc 14 ====-----
Serial Number: 9QJ62GAH
Firmware Version: BN06
Reallocated_Sector_Ct: 0
Current_Pending_Sector: 0
-----==== Disc 15 ====-----
Serial Number: 9QJ77R8F
Firmware Version: SN06
Reallocated_Sector_Ct: 0
Current_Pending_Sector: 0
Добавлю о маркировке дисков.
Сначала я клеил наклейки с номерами дисков. Потом, когда после сборки массива переставлял все диски таким образом чтобы разные диски зеркала оказались на разных линиях питания я понял одну вещь: метить диски наклейками на конзинках глупо. Когда серверов становится больше одного и имеются запасные корзинки для установки дисков перед быстрой заменой сбойных, проще искать нужные диски не по их номеру в конзине, а по зажжённой лампочке при помощи i2c мультиплексора и по серийному номеру диска, часть которого у дисков seagate обычно видна через вентиляционные отверствия корзинки.