Страница 1 из 1

Ошибка w83795 0-002f: Failed to write to register 0x040, err -6

Добавлено: 29 июн 2023, 19:32
Ляксей Батькович
Железо серверное Supermicro X8DTL
На борту Intel Xeon L5630 две штуки.
Память регистровая 8 Gb (2х4).
Используется как рабочая станция в том числе с удаленным доступом к ней. Для мониторинга извне хотел использовать какой-нибудь из свободных инструментов.
Основная ОС Мятный Линукс 20.1 "Люська", с окружением "Корица".
В какой-то момент начал наблюдать, что если делаешь перезагрузку, либо включаешь компьютер после того, как на нем поработали в Linux он начинает издавать вопли в стиле пять коротких и один длинный. Якобы жалуется, что нет оперативной памяти.
Временно решается проблема выключением и включением тумблера на блоке питания, тогда она загружается.
Ищем корень проблемы:
Делаем $ tail -f /var/log/syslog
и видно, что он засоряется сообщениями об ошибках w83795 0-002f: Failed to write to register 0x040, err -6,
а также w83795 0-002f: Failed to read to register 0x040, err -16
регистры постоянно меняются.
Файл журнала достигает 25 Мб и всё повторяется.
Поиск показал, что проблема на этих платах распространенная и тянется аж с ядра 2.6. И связана с программой sensors.
Методом антинаучного тыка и копипаста выяснил, что ошибка началась, когда я решил попробовать две админки cockpit и netdata.
До этого момента аппаратных проблем не возникало и системный журнал не засорялся.
Что помогло решить проблему?
1. Полное удаление netdata и cockpit.
2. Отключение демона fancontrol $ sudo systemctl stop fancontrol и $ sudo systemctl disable fancontrol.
Перезагрузка.Изменил в bios стратегию охлаждения, какую не помню.
Второй день всё работает нормально. В общем, диагноз: потеря связи с микросхемой, отвечающей за автоматическое управление вентиляторами. У меня вентиляторы трехпроводные, ими нельзя управлять.
Ну и адекватного приложения для мониторинга состояния системы больше нет.
Но проблема уже решена.