smartctl Error: ABRT
Mar. 30th, 2016 09:22 amКоллеги умеющие гадать по выводу smartctl -- подскажите!
У меня есть диск. Иногда он издает однократный стучащий звук, прекращая при этом чтение/запись на несколько секунд, а потом возвращается к нормальной работе.
При этом дохнуть он вот уже несколько лет оказывается. Он стоит в зеркальном рейде, его не сильно жалко, но вроде как работает кое как, а покупки есть и поважнее...
При этом в sysctl в самом логе в количестве ошибки ABRT такого вида
Но в статистике по диску ничего особо криминального нет:
Попытка погуглить, никакой упорядоченной справочной информации не принесла, но в некотором количестве дала обсуждения на stackoverflow где говорилось, что это диск не дружит с контроллером таким образом...
Друзья, скажите, это так? У меня сейчас этот диск откнут в pci'ный контроллер (так исторически сложилось), если его переткнуть в материнскую плату все может решиться? Или как вообще с этим быть?
У меня есть диск. Иногда он издает однократный стучащий звук, прекращая при этом чтение/запись на несколько секунд, а потом возвращается к нормальной работе.
При этом дохнуть он вот уже несколько лет оказывается. Он стоит в зеркальном рейде, его не сильно жалко, но вроде как работает кое как, а покупки есть и поважнее...
При этом в sysctl в самом логе в количестве ошибки ABRT такого вида
Error 239 occurred at disk power-on lifetime: 0 hours (0 days + 0 hours) When the command that caused the error occurred, the device was active or idle. After command completion occurred, registers were: ER ST SC SN CL CH DH -- -- -- -- -- -- -- 04 51 01 51 01 00 a0 Error: ABRT Commands leading to the command that caused the error were: CR FR SC SN CL CH DH DC Powered_Up_Time Command/Feature_Name -- -- -- -- -- -- -- -- ---------------- -------------------- b0 d6 01 be 4f c2 a0 00 00:03:04.815 SMART WRITE LOG 80 45 0b 00 44 57 a0 00 00:03:04.811 [VENDOR SPECIFIC] 10 00 00 00 00 00 e0 00 00:03:04.721 RECALIBRATE [OBS-4] b0 d6 01 be 4f c2 a0 00 00:03:02.143 SMART WRITE LOG 80 45 0b 00 44 57 a0 00 00:03:02.136 [VENDOR SPECIFIC]
Но в статистике по диску ничего особо криминального нет:
SMART Attributes Data Structure revision number: 16 Vendor Specific SMART Attributes with Thresholds: ID# ATTRIBUTE_NAME FLAG VALUE WORST THRESH TYPE UPDATED WHEN_FAILED RAW_VALUE 1 Raw_Read_Error_Rate 0x002f 200 183 051 Pre-fail Always - 0 3 Spin_Up_Time 0x0027 181 162 021 Pre-fail Always - 5950 4 Start_Stop_Count 0x0032 100 100 000 Old_age Always - 642 5 Reallocated_Sector_Ct 0x0033 200 200 140 Pre-fail Always - 0 7 Seek_Error_Rate 0x002e 200 200 000 Old_age Always - 0 9 Power_On_Hours 0x0032 066 066 000 Old_age Always - 24850 10 Spin_Retry_Count 0x0032 100 100 000 Old_age Always - 0 11 Calibration_Retry_Count 0x0032 100 100 000 Old_age Always - 0 12 Power_Cycle_Count 0x0032 100 100 000 Old_age Always - 641 192 Power-Off_Retract_Count 0x0032 200 200 000 Old_age Always - 309 193 Load_Cycle_Count 0x0032 032 032 000 Old_age Always - 504761 194 Temperature_Celsius 0x0022 115 101 000 Old_age Always - 35 196 Reallocated_Event_Count 0x0032 200 200 000 Old_age Always - 0 197 Current_Pending_Sector 0x0032 200 200 000 Old_age Always - 0 198 Offline_Uncorrectable 0x0030 200 200 000 Old_age Offline - 0 199 UDMA_CRC_Error_Count 0x0032 200 200 000 Old_age Always - 1 200 Multi_Zone_Error_Rate 0x0008 200 200 000 Old_age Offline - 0
Попытка погуглить, никакой упорядоченной справочной информации не принесла, но в некотором количестве дала обсуждения на stackoverflow где говорилось, что это диск не дружит с контроллером таким образом...
Друзья, скажите, это так? У меня сейчас этот диск откнут в pci'ный контроллер (так исторически сложилось), если его переткнуть в материнскую плату все может решиться? Или как вообще с этим быть?
no subject
Date: 2016-03-30 09:12 am (UTC)Очень может быть.
Контроллер отдаёт диску команду, который диск не понимает, он паркует головки и перезапускает контроллер. После чего продолжает нормально работать.
no subject
Date: 2016-03-30 09:45 am (UTC)надо еще температуру перепроверить(вентиляторы, пыль, винты разнести в системнике и т.д.):
Temperature_Celsius => 115 101
возможно из-за этого вверх поползи(там еще пороги превышены):
Spin_Up_Time => 181 162
Raw_Read_Error_Rate => 200 183
p.s.:
по raid, подсказать не могу(надо еще конкретные модели смотреть), давно занимался и пр.