Страница 1 из 2

Ошибки чтения секторов на HDD

Добавлено: 20 янв 2017, 12:25
Chocobo
Поймал на одном своих немолодых HDD (Power_On_Hours = 28397) проблему с запуском, сопровождающуюся ошибкой:
ata2.01: status: { DRDY ERR }

Подцепив диск к соседнему хосту при обращении к нему в dmesg нарисовалось следующее:

Код: Выделить всё

[  956.085746] ata5.00: status: { DRDY ERR }
[  956.085748] ata5.00: error: { UNC }
[  956.087466] ata5.00: configured for UDMA/133
[  956.087482] sd 4:0:0:0: [sda] tag#0 FAILED Result: hostbyte=DID_OK driverbyte=DRIVER_SENSE
[  956.087487] sd 4:0:0:0: [sda] tag#0 Sense Key : Medium Error [current] [descriptor] 
[  956.087490] sd 4:0:0:0: [sda] tag#0 Add. Sense: Unrecovered read error - auto reallocate failed
[  956.087494] sd 4:0:0:0: [sda] tag#0 CDB: Read(10) 28 00 00 00 08 08 00 00 08 00
[  956.087497] blk_update_request: I/O error, dev sda, sector 2063
[  956.087501] Buffer I/O error on dev sda1, logical block 1, async page read
[  956.087515] ata5: EH complete
[  958.227390] ata5.00: exception Emask 0x0 SAct 0x1000000 SErr 0x0 action 0x0
[  958.227405] ata5.00: irq_stat 0x40000008
[  958.227409] ata5.00: failed command: READ FPDMA QUEUED
[  958.227414] ata5.00: cmd 60/08:c0:08:08:00/00:00:00:00:00/40 tag 24 ncq 4096 in
			res 41/40:00:0f:08:00/00:00:00:00:00/40 Emask 0x409 (media error) <F>
[  958.227454]blk_update_request: I/O error, dev sda, sector 4110
[  958.227477] Buffer I/O error on dev sda1, logical block 1, async page read
smartctl -a /dev/sda тоже засек проблему :sad:

Код: Выделить всё

  -- -- -- -- -- -- --
  40 51 00 0e 10 00 40  Error: UNC at LBA = 0x0000100e = 4110
Исходя из соображения что 2063-й и 4110 сектор при его размере в 512 байт уже не относится к таблице разделов а по порядку находится где то в начале второго ((((2063*512)/1024)/1024)=1.007324) и третьего((((4110*512)/1024)/1024)=2.006836) мегабайта (и mbr зацепить не должен) было решено откусить несколько мегабайт в начале, чтоб дать шанс железке героически скончаться при исполнении служебных подвигов (разумеется без хранения критичной инфы в единичном экземпляре), а не подвергнуться забвению на полке :smile:
Снимок экрана_2017-01-20_12-01-13.png
Снимок экрана_2017-01-20_12-02-00.png
После этой несложной арифметики, забил его файлом с нулями (dd) для проверки не всплывут ли еще сбои - Все прошло успешно.
Ничего сверхестественного, но может кому-то придется полезным. Если бы проблемные сектора всплыли в середине диска - можно оставить неразмеченную область между разделами там

Ошибки чтения секторов на HDD

Добавлено: 20 янв 2017, 13:13
di_mok
Кстати, совершенно случайно наткнулся на аналог mhdd под линукс https://github.com/krieger-od/whdd

Ошибки чтения секторов на HDD

Добавлено: 20 янв 2017, 21:30
Chocobo
Эх. тоже немного уйду в оффтоп :sad:
Проблема с секторами ушла на нет, на созданный выше раздел заинсталлил ось, ребутнулся - все ок.
Но спустя некоторое время ось начала вставать колом, хард судя по всему потерялся на лету (собрать анамнез не удалось, т.к. ни одна утилита не стартовала, терминал, чей рабочий набор памяти жил в оперативе только беспомощно подмигивал курсором с периодическими фризами всего) После перезагрузки reset'ом - знакомая картинка:

Диска биос больше не нашел :sad:

Зацепил обратно к другому десктопу - все гуд, только автоматом восстановилось несколько потерянных inode судя по dmesg:

Код: Выделить всё

[   69.116972] EXT4-fs (sda1): 273 orphan inodes deleted
[   69.116976] EXT4-fs (sda1): recovery complete
[   69.314627] EXT4-fs (sda1): mounted filesystem with ordered data mode. Opts: (null)
Опять забил весь нулями - 372 гб пролетели без проблем

Код: Выделить всё

chocobo@desktop ~ $ ls -l /mnt/testfile 
-rw-r--r-- 1 root root 390960017408 янв 20 20:08 /mnt/testfile
chocobo@desktop ~ $ df -h
Файл.система   Размер Использовано  Дост Использовано% Cмонтировано в
...
/dev/sda1        367G         367G     0          100% /mnt

Видимо пришла очередь прощаться с PSU. Комплексная проблема - коварная штука, вроде и хард был с unrecoverable секторами, так еще и БП чудит :bravo:

Сейчас воткнул туда ноутбучный 2,5" хард на 5400 rpm, которому мощей нужно поменьше - вот уже несколько часов работает, зараза

Ошибки чтения секторов на HDD

Добавлено: 20 янв 2017, 21:43
KVF
Chocobo писал(а): воткнул туда ноутбучный 2,5" хард на 5400 rpm, которому мощей нужно поменьше
Кой разница ? Если БП накрылся , то глюк будет с любым хардом .

Ошибки чтения секторов на HDD

Добавлено: 20 янв 2017, 21:48
Chocobo
KVF, ну он пока не пшикнул черным дымом, просто недостаточно мощей выдает :smile:

Ошибки чтения секторов на HDD

Добавлено: 20 янв 2017, 21:49
KVF
Да , а как определил ?

Ошибки чтения секторов на HDD

Добавлено: 20 янв 2017, 21:52
Chocobo
Не замерял (нечем дома), но вот уже четыре с половиной часа аптайма с активным мультимедиа содержимым
5400_hdd.png

Ошибки чтения секторов на HDD

Добавлено: 20 янв 2017, 21:57
KVF
ИБП стоит ? Проверь напряжение на выходе или подключи напрямую .

Ошибки чтения секторов на HDD

Добавлено: 20 янв 2017, 22:06
Chocobo
KVF, не, напрямую к розетке. Входное конечно там можно замерить, но сомневаюсь что дело снаружи.
Перекочевал этот БП с основного десктопа, где до апгрейда тоже чудили этот хард и его полутеровый ровесник (с учетом их возраста я спокойно бы воспринял гибель), но ссдшка без хардов работала норм, а те могли на лету отвалиться, тогда на hdd был /home и /var, а на ssd корень со всем остальным - в dmesg явно было видно потерю девайса и переинициализацию оборудования.

Не исключено что этим насилием и заработал битые сектора, с которых чегодня начал...

Ошибки чтения секторов на HDD

Добавлено: 20 янв 2017, 22:23
Restart1566
А как быть вот с этим?
[ 956.087490] sd 4:0:0:0: [sda] tag#0 Add. Sense: Unrecovered read error - auto reallocate failed
Похоже, диск на покой просится

Ошибки чтения секторов на HDD

Добавлено: 20 янв 2017, 22:45
Chocobo
Restart1566, С этого и началась тема траблшутинга, нашлись два бэда к которым I/O Error
Смарт еще выглядит норм, учитывая срок службы

Код: Выделить всё

SMART Attributes Data Structure revision number: 16
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME          FLAG     VALUE WORST THRESH TYPE      UPDATED  WHEN_FAILED RAW_VALUE
  1 Raw_Read_Error_Rate     0x000f   200   192   051    Pre-fail  Always       -       9
  3 Spin_Up_Time            0x0003   224   019   021    Pre-fail  Always   In_the_past 3800
  4 Start_Stop_Count        0x0032   093   093   000    Old_age   Always       -       7932
  5 Reallocated_Sector_Ct   0x0033   200   200   140    Pre-fail  Always       -       0
  7 Seek_Error_Rate         0x000e   200   200   051    Old_age   Always       -       0
  9 Power_On_Hours          0x0032   062   062   000    Old_age   Always       -       28407
 10 Spin_Retry_Count        0x0012   100   100   051    Old_age   Always       -       0
 11 Calibration_Retry_Count 0x0012   100   100   051    Old_age   Always       -       0
 12 Power_Cycle_Count       0x0032   094   094   000    Old_age   Always       -       6453
192 Power-Off_Retract_Count 0x0032   197   197   000    Old_age   Always       -       2467
193 Load_Cycle_Count        0x0032   198   198   000    Old_age   Always       -       7977
194 Temperature_Celsius     0x0022   110   087   000    Old_age   Always       -       40
196 Reallocated_Event_Count 0x0032   200   200   000    Old_age   Always       -       0
197 Current_Pending_Sector  0x0012   200   199   000    Old_age   Always       -       1
198 Offline_Uncorrectable   0x0010   200   200   000    Old_age   Offline      -       0
199 UDMA_CRC_Error_Count    0x003e   200   200   000    Old_age   Always       -       2402
200 Multi_Zone_Error_Rate   0x0008   200   200   051    Old_age   Offline      -       0

Ошибки чтения секторов на HDD

Добавлено: 20 янв 2017, 22:52
KVF
Restart1566 писал(а): Похоже, диск на покой просится
Покажи -

Код: Выделить всё

 sudo smartctl -a /dev/sda | grep Offline_Uncorrectable

Ошибки чтения секторов на HDD

Добавлено: 20 янв 2017, 22:55
Chocobo
чуть выше есть весь :smile:

Отправлено спустя 1 минуту 44 секунды:
Ну и собственно сам пациент, чтоб было ясно очем мы тут

Код: Выделить всё

=== START OF INFORMATION SECTION ===
Model Family:     Western Digital Caviar Blue Serial ATA
Device Model:     WDC WD4000AAJS-65TKA0
Serial Number:    WD-WCAPW5634842
LU WWN Device Id: 5 0014ee 256105d6f
Firmware Version: 12.01C01
User Capacity:    400 088 457 216 bytes [400 GB]
Sector Size:      512 bytes logical/physical
Device is:        In smartctl database [for details use: -P show]
ATA Version is:   ATA/ATAPI-7 (minor revision not indicated)
Local Time is:    Fri Jan 20 22:43:07 2017 MSK
SMART support is: Available - device has SMART capability.
SMART support is: Enabled

Ошибки чтения секторов на HDD

Добавлено: 20 янв 2017, 22:58
Restart1566
Chocobo писал(а): Restart1566, С этого и началась тема траблшутинга, нашлись два бэда к которым I/O Error
Смарт еще выглядит норм, учитывая срок службы
Да не в ошибке дело, а в том, что диск уже её исправить не может

Ошибки чтения секторов на HDD

Добавлено: 20 янв 2017, 23:01
KVF
Restart1566 писал(а): диск уже её исправить не может
Как это ?

Ошибки чтения секторов на HDD

Добавлено: 20 янв 2017, 23:02
Chocobo
Restart1566, потому и не стал лезть в reallocate, а решил выкусить сбойный кусок,
откуда нарисовались эти два сектора - точной инфы нет, и если распад продолжится - несомненно подохнет.
Но если оно побилось именно из-за внезапных остановок или физического воздействия - то и похрену, остальные могут и нажить еще долго и счастливо с у четом того, что есть два рядом, и больше нету

Ошибки чтения секторов на HDD

Добавлено: 20 янв 2017, 23:07
Restart1566
если бы "если оно побилось именно из-за внезапных остановок или физического воздействия" сообщение было бы другое. В совпадение как-то не верится...

Ошибки чтения секторов на HDD

Добавлено: 20 янв 2017, 23:23
Chocobo
Restart1566, проявления аппаратной "техномагии" - имеют место в нашем мире без волшебства :smile:
На днях поменяю PSU и запробую с тем же хардом. Там уже можно и whdd заюзать из (Пост di_mok #8330)
А в перспективе - покажет время. Этот хард со мной уже шесть или семь лет (и принесли чутка юзанным) :smile:

Ошибки чтения секторов на HDD

Добавлено: 20 янв 2017, 23:29
Restart1566
Хозяин - барин...

Ошибки чтения секторов на HDD

Добавлено: 20 янв 2017, 23:31
Unborn
Chocobo, на 5В шине не хватает напряжения скорее всего. А для дисков это - писец в пути. Северный полярный круг он к тебе уже перешёл.