Страница 1 из 2
Ошибки чтения секторов на HDD
Добавлено: 20 янв 2017, 12:25
Chocobo
Поймал на одном своих немолодых HDD (Power_On_Hours = 28397) проблему с запуском, сопровождающуюся ошибкой:
ata2.01: status: { DRDY ERR }
Подцепив диск к соседнему хосту при обращении к нему в dmesg нарисовалось следующее:
Код: Выделить всё
[ 956.085746] ata5.00: status: { DRDY ERR }
[ 956.085748] ata5.00: error: { UNC }
[ 956.087466] ata5.00: configured for UDMA/133
[ 956.087482] sd 4:0:0:0: [sda] tag#0 FAILED Result: hostbyte=DID_OK driverbyte=DRIVER_SENSE
[ 956.087487] sd 4:0:0:0: [sda] tag#0 Sense Key : Medium Error [current] [descriptor]
[ 956.087490] sd 4:0:0:0: [sda] tag#0 Add. Sense: Unrecovered read error - auto reallocate failed
[ 956.087494] sd 4:0:0:0: [sda] tag#0 CDB: Read(10) 28 00 00 00 08 08 00 00 08 00
[ 956.087497] blk_update_request: I/O error, dev sda, sector 2063
[ 956.087501] Buffer I/O error on dev sda1, logical block 1, async page read
[ 956.087515] ata5: EH complete
[ 958.227390] ata5.00: exception Emask 0x0 SAct 0x1000000 SErr 0x0 action 0x0
[ 958.227405] ata5.00: irq_stat 0x40000008
[ 958.227409] ata5.00: failed command: READ FPDMA QUEUED
[ 958.227414] ata5.00: cmd 60/08:c0:08:08:00/00:00:00:00:00/40 tag 24 ncq 4096 in
res 41/40:00:0f:08:00/00:00:00:00:00/40 Emask 0x409 (media error) <F>
[ 958.227454]blk_update_request: I/O error, dev sda, sector 4110
[ 958.227477] Buffer I/O error on dev sda1, logical block 1, async page read
smartctl -a /dev/sda тоже засек проблему
Код: Выделить всё
-- -- -- -- -- -- --
40 51 00 0e 10 00 40 Error: UNC at LBA = 0x0000100e = 4110
Исходя из соображения что 2063-й и 4110 сектор при его размере в 512 байт уже не относится к таблице разделов а по порядку находится где то в начале второго ((((2063*512)/1024)/1024)=1.007324) и третьего((((4110*512)/1024)/1024)=2.006836) мегабайта (и mbr зацепить не должен) было решено откусить несколько мегабайт в начале, чтоб дать шанс железке героически скончаться при исполнении служебных подвигов (разумеется без хранения критичной инфы в единичном экземпляре), а не подвергнуться забвению на полке
После этой несложной арифметики, забил его файлом с нулями (
dd
) для проверки не всплывут ли еще сбои - Все прошло успешно.
Ничего сверхестественного, но может кому-то придется полезным. Если бы проблемные сектора всплыли в середине диска - можно оставить неразмеченную область между разделами там
Ошибки чтения секторов на HDD
Добавлено: 20 янв 2017, 13:13
di_mok
Кстати, совершенно случайно наткнулся на аналог mhdd под линукс
https://github.com/krieger-od/whdd
Ошибки чтения секторов на HDD
Добавлено: 20 янв 2017, 21:30
Chocobo
Эх. тоже немного уйду в оффтоп
Проблема с секторами ушла на нет, на созданный выше раздел заинсталлил ось, ребутнулся - все ок.
Но спустя некоторое время ось начала вставать колом, хард судя по всему потерялся на лету (собрать анамнез не удалось, т.к. ни одна утилита не стартовала, терминал, чей рабочий набор памяти жил в оперативе только беспомощно подмигивал курсором с периодическими фризами всего) После перезагрузки reset'ом - знакомая картинка:
Диска биос больше не нашел
Зацепил обратно к другому десктопу - все гуд, только автоматом восстановилось несколько потерянных inode судя по dmesg:
Код: Выделить всё
[ 69.116972] EXT4-fs (sda1): 273 orphan inodes deleted
[ 69.116976] EXT4-fs (sda1): recovery complete
[ 69.314627] EXT4-fs (sda1): mounted filesystem with ordered data mode. Opts: (null)
Опять забил весь нулями - 372 гб пролетели без проблем
Код: Выделить всё
chocobo@desktop ~ $ ls -l /mnt/testfile
-rw-r--r-- 1 root root 390960017408 янв 20 20:08 /mnt/testfile
chocobo@desktop ~ $ df -h
Файл.система Размер Использовано Дост Использовано% Cмонтировано в
...
/dev/sda1 367G 367G 0 100% /mnt
Видимо пришла очередь прощаться с
PSU. Комплексная проблема - коварная штука, вроде и хард был с unrecoverable секторами, так еще и БП чудит
Сейчас воткнул туда ноутбучный 2,5" хард на 5400 rpm, которому мощей нужно поменьше - вот уже несколько часов работает, зараза
Ошибки чтения секторов на HDD
Добавлено: 20 янв 2017, 21:43
KVF
Chocobo писал(а): воткнул туда ноутбучный 2,5" хард на 5400 rpm, которому мощей нужно поменьше
Кой разница ? Если БП накрылся , то глюк будет с любым хардом .
Ошибки чтения секторов на HDD
Добавлено: 20 янв 2017, 21:48
Chocobo
KVF, ну он пока не пшикнул черным дымом, просто недостаточно мощей выдает
Ошибки чтения секторов на HDD
Добавлено: 20 янв 2017, 21:49
KVF
Да , а как определил ?
Ошибки чтения секторов на HDD
Добавлено: 20 янв 2017, 21:52
Chocobo
Не замерял (нечем дома), но вот уже четыре с половиной часа аптайма с активным мультимедиа содержимым
Ошибки чтения секторов на HDD
Добавлено: 20 янв 2017, 21:57
KVF
ИБП стоит ? Проверь напряжение на выходе или подключи напрямую .
Ошибки чтения секторов на HDD
Добавлено: 20 янв 2017, 22:06
Chocobo
KVF, не, напрямую к розетке. Входное конечно там можно замерить, но сомневаюсь что дело снаружи.
Перекочевал этот БП с основного десктопа, где до апгрейда тоже чудили этот хард и его полутеровый ровесник (с учетом их возраста я спокойно бы воспринял гибель), но ссдшка без хардов работала норм, а те могли на лету отвалиться, тогда на hdd был /home и /var, а на ssd корень со всем остальным - в dmesg явно было видно потерю девайса и переинициализацию оборудования.
Не исключено что этим насилием и заработал битые сектора, с которых чегодня начал...
Ошибки чтения секторов на HDD
Добавлено: 20 янв 2017, 22:23
Restart1566
А как быть вот с этим?
[ 956.087490] sd 4:0:0:0: [sda] tag#0 Add. Sense: Unrecovered read error - auto reallocate failed
Похоже, диск на покой просится
Ошибки чтения секторов на HDD
Добавлено: 20 янв 2017, 22:45
Chocobo
Restart1566, С этого и началась тема траблшутинга, нашлись два бэда к которым I/O Error
Смарт еще выглядит норм, учитывая срок службы
Код: Выделить всё
SMART Attributes Data Structure revision number: 16
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME FLAG VALUE WORST THRESH TYPE UPDATED WHEN_FAILED RAW_VALUE
1 Raw_Read_Error_Rate 0x000f 200 192 051 Pre-fail Always - 9
3 Spin_Up_Time 0x0003 224 019 021 Pre-fail Always In_the_past 3800
4 Start_Stop_Count 0x0032 093 093 000 Old_age Always - 7932
5 Reallocated_Sector_Ct 0x0033 200 200 140 Pre-fail Always - 0
7 Seek_Error_Rate 0x000e 200 200 051 Old_age Always - 0
9 Power_On_Hours 0x0032 062 062 000 Old_age Always - 28407
10 Spin_Retry_Count 0x0012 100 100 051 Old_age Always - 0
11 Calibration_Retry_Count 0x0012 100 100 051 Old_age Always - 0
12 Power_Cycle_Count 0x0032 094 094 000 Old_age Always - 6453
192 Power-Off_Retract_Count 0x0032 197 197 000 Old_age Always - 2467
193 Load_Cycle_Count 0x0032 198 198 000 Old_age Always - 7977
194 Temperature_Celsius 0x0022 110 087 000 Old_age Always - 40
196 Reallocated_Event_Count 0x0032 200 200 000 Old_age Always - 0
197 Current_Pending_Sector 0x0012 200 199 000 Old_age Always - 1
198 Offline_Uncorrectable 0x0010 200 200 000 Old_age Offline - 0
199 UDMA_CRC_Error_Count 0x003e 200 200 000 Old_age Always - 2402
200 Multi_Zone_Error_Rate 0x0008 200 200 051 Old_age Offline - 0
Ошибки чтения секторов на HDD
Добавлено: 20 янв 2017, 22:52
KVF
Restart1566 писал(а): Похоже, диск на покой просится
Покажи -
Код: Выделить всё
sudo smartctl -a /dev/sda | grep Offline_Uncorrectable
Ошибки чтения секторов на HDD
Добавлено: 20 янв 2017, 22:55
Chocobo
чуть выше есть весь
Отправлено спустя 1 минуту 44 секунды:
Ну и собственно сам пациент, чтоб было ясно очем мы тут
Код: Выделить всё
=== START OF INFORMATION SECTION ===
Model Family: Western Digital Caviar Blue Serial ATA
Device Model: WDC WD4000AAJS-65TKA0
Serial Number: WD-WCAPW5634842
LU WWN Device Id: 5 0014ee 256105d6f
Firmware Version: 12.01C01
User Capacity: 400 088 457 216 bytes [400 GB]
Sector Size: 512 bytes logical/physical
Device is: In smartctl database [for details use: -P show]
ATA Version is: ATA/ATAPI-7 (minor revision not indicated)
Local Time is: Fri Jan 20 22:43:07 2017 MSK
SMART support is: Available - device has SMART capability.
SMART support is: Enabled
Ошибки чтения секторов на HDD
Добавлено: 20 янв 2017, 22:58
Restart1566
Chocobo писал(а): Restart1566, С этого и началась тема траблшутинга, нашлись два бэда к которым I/O Error
Смарт еще выглядит норм, учитывая срок службы
Да не в ошибке дело, а в том, что диск уже её исправить не может
Ошибки чтения секторов на HDD
Добавлено: 20 янв 2017, 23:01
KVF
Restart1566 писал(а): диск уже её исправить не может
Как это ?
Ошибки чтения секторов на HDD
Добавлено: 20 янв 2017, 23:02
Chocobo
Restart1566, потому и не стал лезть в reallocate, а решил выкусить сбойный кусок,
откуда нарисовались эти два сектора - точной инфы нет, и если распад продолжится - несомненно подохнет.
Но если оно побилось именно из-за внезапных остановок или физического воздействия - то и похрену, остальные могут и нажить еще долго и счастливо с у четом того, что есть два рядом, и больше нету
Ошибки чтения секторов на HDD
Добавлено: 20 янв 2017, 23:07
Restart1566
если бы "если оно побилось именно из-за внезапных остановок или физического воздействия" сообщение было бы другое. В совпадение как-то не верится...
Ошибки чтения секторов на HDD
Добавлено: 20 янв 2017, 23:23
Chocobo
Restart1566, проявления аппаратной "техномагии" - имеют место в нашем мире без волшебства
На днях поменяю PSU и запробую с тем же хардом. Там уже можно и whdd заюзать из
(Пост di_mok #8330)
А в перспективе - покажет время. Этот хард со мной уже шесть или семь лет (и принесли чутка юзанным)
Ошибки чтения секторов на HDD
Добавлено: 20 янв 2017, 23:29
Restart1566
Хозяин - барин...
Ошибки чтения секторов на HDD
Добавлено: 20 янв 2017, 23:31
Unborn
Chocobo, на 5В шине не хватает напряжения скорее всего. А для дисков это - писец в пути. Северный полярный круг он к тебе уже перешёл.