nataraj: (Бритый небритый)
[personal profile] nataraj
Коллеги умеющие гадать по выводу smartctl -- подскажите!

У меня есть диск. Иногда он издает однократный стучащий звук, прекращая при этом чтение/запись на несколько секунд, а потом возвращается к нормальной работе.

При этом дохнуть он вот уже несколько лет оказывается. Он стоит в зеркальном рейде, его не сильно жалко, но вроде как работает кое как, а покупки есть и поважнее...

При этом в sysctl в самом логе в количестве ошибки ABRT такого вида
Error 239 occurred at disk power-on lifetime: 0 hours (0 days + 0 hours)
  When the command that caused the error occurred, the device was active or idle.

  After command completion occurred, registers were:
  ER ST SC SN CL CH DH
  -- -- -- -- -- -- --
  04 51 01 51 01 00 a0  Error: ABRT

  Commands leading to the command that caused the error were:
  CR FR SC SN CL CH DH DC   Powered_Up_Time  Command/Feature_Name
  -- -- -- -- -- -- -- --  ----------------  --------------------
  b0 d6 01 be 4f c2 a0 00      00:03:04.815  SMART WRITE LOG
  80 45 0b 00 44 57 a0 00      00:03:04.811  [VENDOR SPECIFIC]
  10 00 00 00 00 00 e0 00      00:03:04.721  RECALIBRATE [OBS-4]
  b0 d6 01 be 4f c2 a0 00      00:03:02.143  SMART WRITE LOG
  80 45 0b 00 44 57 a0 00      00:03:02.136  [VENDOR SPECIFIC]


Но в статистике по диску ничего особо криминального нет:
SMART Attributes Data Structure revision number: 16
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME          FLAG     VALUE WORST THRESH TYPE      UPDATED  WHEN_FAILED RAW_VALUE
  1 Raw_Read_Error_Rate     0x002f   200   183   051    Pre-fail  Always       -       0
  3 Spin_Up_Time            0x0027   181   162   021    Pre-fail  Always       -       5950
  4 Start_Stop_Count        0x0032   100   100   000    Old_age   Always       -       642
  5 Reallocated_Sector_Ct   0x0033   200   200   140    Pre-fail  Always       -       0
  7 Seek_Error_Rate         0x002e   200   200   000    Old_age   Always       -       0
  9 Power_On_Hours          0x0032   066   066   000    Old_age   Always       -       24850
 10 Spin_Retry_Count        0x0032   100   100   000    Old_age   Always       -       0
 11 Calibration_Retry_Count 0x0032   100   100   000    Old_age   Always       -       0
 12 Power_Cycle_Count       0x0032   100   100   000    Old_age   Always       -       641
192 Power-Off_Retract_Count 0x0032   200   200   000    Old_age   Always       -       309
193 Load_Cycle_Count        0x0032   032   032   000    Old_age   Always       -       504761
194 Temperature_Celsius     0x0022   115   101   000    Old_age   Always       -       35
196 Reallocated_Event_Count 0x0032   200   200   000    Old_age   Always       -       0
197 Current_Pending_Sector  0x0032   200   200   000    Old_age   Always       -       0
198 Offline_Uncorrectable   0x0030   200   200   000    Old_age   Offline      -       0
199 UDMA_CRC_Error_Count    0x0032   200   200   000    Old_age   Always       -       1
200 Multi_Zone_Error_Rate   0x0008   200   200   000    Old_age   Offline      -       0


Попытка погуглить, никакой упорядоченной справочной информации не принесла, но в некотором количестве дала обсуждения на stackoverflow где говорилось, что это диск не дружит с контроллером таким образом...

Друзья, скажите, это так? У меня сейчас этот диск откнут в pci'ный контроллер (так исторически сложилось), если его переткнуть в материнскую плату все может решиться? Или как вообще с этим быть?

Date: 2016-03-30 09:12 am (UTC)
From: [identity profile] aceler.livejournal.com
> at disk power-on lifetime: 0 hours (0 days + 0 hours)

Очень может быть.

Контроллер отдаёт диску команду, который диск не понимает, он паркует головки и перезапускает контроллер. После чего продолжает нормально работать.

Date: 2016-03-30 09:45 am (UTC)
From: [identity profile] frozen-cat.livejournal.com
Имхается,
надо еще температуру перепроверить(вентиляторы, пыль, винты разнести в системнике и т.д.):

Temperature_Celsius => 115 101

возможно из-за этого вверх поползи(там еще пороги превышены):
Spin_Up_Time => 181 162
Raw_Read_Error_Rate => 200 183

p.s.:
по raid, подсказать не могу(надо еще конкретные модели смотреть), давно занимался и пр.

Profile

nataraj: (Default)
Swami Dhyan Nataraj

July 2024

S M T W T F S
 123456
789 10111213
14151617181920
21222324252627
28293031   

Most Popular Tags

Style Credit

Expand Cut Tags

No cut tags
Page generated Jan. 20th, 2026 06:50 am
Powered by Dreamwidth Studios