Страница 2 из 2

Вопрос к гуру

Добавлено: 13 окт 2020, 21:51
FreeStyler
M_o_n_g_o_l писал(а):
13 окт 2020, 11:25
Стоит ещё третьей системой MX Linux 19.2 KDE, так там такого вообще не происходит,
ну если на MX норм. - значит не в железе дело, в первую очередь с ядрами поиграйся. У меня вроде было подобное давно - на debian'е происходило. Оказалось ядро не то, я тогда не знал как ядро менять - поэтому переставил бубунту, всё нормально стало.

Вопрос к гуру

Добавлено: 14 окт 2020, 17:13
M_o_n_g_o_l
Вот сегодня произошла ситуация. Вот log на это время. Кто-нить чего понял? Там в районе 16:54.

Код: Выделить всё

Oct 14 16:40:40 mike-System dbus-daemon[1702]: [system] Activating via systemd: service name='org.freedesktop.fwupd' unit='fwupd.service' requested by ':1.114' (uid=62803 pid=10672 comm="/usr/bin/fwupdmgr refresh --no-metadata-check " label="unconfined")
Oct 14 16:40:40 mike-System systemd[1]: Starting Firmware update daemon...
Oct 14 16:40:40 mike-System fwupd[10687]: 13:40:40:0364 FuEngine             device af0df4770cd10906d7dcaf18a213cce8cab70f5b [KINGSTON SV300S37A480G] does not define a vendor-id!
Oct 14 16:40:40 mike-System fwupd[10687]: 13:40:40:0368 FuEngine             device 9836d51c4caccfd326491cad0de1017d3ad789bd [KINGSTON SA400S37960G] does not define a vendor-id!
Oct 14 16:40:40 mike-System fwupd[10687]: 13:40:40:0381 FuEngine             device 602b0a6cc821d155208724f0e22f8d111542b74c [TOSHIBA HDWD120] does not define a vendor-id!
Oct 14 16:40:40 mike-System fwupd[10687]: 13:40:40:0388 FuEngine             device 0a8c36d4c09c803cd6b5861e443fb7a41a20cbe6 [TOSHIBA HDWD120] does not define a vendor-id!
Oct 14 16:40:40 mike-System fwupd[10687]: 13:40:40:0393 FuEngine             device f219ac034743df43be49a235e41f128dd47d855f [WDC WD30PURZ-85GU6Y0] does not define a vendor-id!
Oct 14 16:40:40 mike-System dbus-daemon[1702]: [system] Successfully activated service 'org.freedesktop.fwupd'
Oct 14 16:40:40 mike-System systemd[1]: Started Firmware update daemon.
Oct 14 16:40:40 mike-System systemd[1]: fwupd-refresh.service: Succeeded.
Oct 14 16:40:40 mike-System systemd[1]: Finished Refresh fwupd metadata and update motd.
Oct 14 16:54:41 mike-System kernel: [15998.991636] NVRM: GPU at PCI:0000:03:00: GPU-46f5ebcf-744a-f02c-a77c-17d344c6bb5e
Oct 14 16:54:41 mike-System kernel: [15998.991648] NVRM: Xid (PCI:0000:03:00): 31, pid=3740, Ch 0000002b, intr 10000000. MMU Fault: ENGINE HOST0 HUBCLIENT_HOST faulted @ 0x1_08a20000. Fault is of type FAULT_INFO_TYPE_UNSUPPORTED_KIND ACCESS_TYPE_READ
Oct 14 16:54:41 mike-System kernel: [15999.107839] NVRM: Xid (PCI:0000:03:00): 62, pid=3740, 0a99(18a4) 00000000 00000000
Oct 14 16:57:55 mike-System kernel: [16192.683694] INFO: task Xorg:1915 blocked for more than 120 seconds.
Oct 14 16:57:55 mike-System kernel: [16192.683699]       Tainted: P          IOE     5.4.0-51-generic #56-Ubuntu
Oct 14 16:57:55 mike-System kernel: [16192.683702] "echo 0 > /proc/sys/kernel/hung_task_timeout_secs" disables this message.
Oct 14 16:57:55 mike-System kernel: [16192.683704] Xorg            D    0  1915   1886 0x00400004
Oct 14 16:57:55 mike-System kernel: [16192.683708] Call Trace:
Oct 14 16:57:55 mike-System kernel: [16192.683719]  __schedule+0x2e3/0x740
Oct 14 16:57:55 mike-System kernel: [16192.683725]  ? cpufreq_dbs_governor_start+0x180/0x180
Oct 14 16:57:55 mike-System kernel: [16192.683730]  ? update_blocked_averages+0x11c/0x590
Oct 14 16:57:55 mike-System kernel: [16192.683733]  schedule+0x42/0xb0
Oct 14 16:57:55 mike-System kernel: [16192.683737]  schedule_timeout+0x10e/0x160
Oct 14 16:57:55 mike-System kernel: [16192.683741]  ? update_sd_lb_stats+0x6d2/0x7d0

Вопрос к гуру

Добавлено: 14 окт 2020, 17:26
M_o_n_g_o_l
И как я понял, всё же то это проблемы с драйвером на видеокарту. ((

Вопрос к гуру

Добавлено: 14 окт 2020, 17:53
slant
M_o_n_g_o_l писал(а):
14 окт 2020, 17:26
И как я понял, всё же то это проблемы с драйвером на видеокарту. ((
Неправильно понял. Повисла железка, о чем драйвер ядру и доложил.

Вопрос к гуру

Добавлено: 14 окт 2020, 17:57
M_o_n_g_o_l
slant, На форуме Nvidia, говорят, что это дефект в сегментации драйвера, который никто не хочет/не будет устранять.

Вопрос к гуру

Добавлено: 14 окт 2020, 18:17
slant
M_o_n_g_o_l писал(а):
14 окт 2020, 17:57
slant, На форуме Nvidia, говорят, что это дефект в сегментации драйвера, который никто не хочет/не будет устранять.
Говорить на форуме могут много что, но в случае segmantation fault - оно в логе прямым текстом пишется. Здесь же явно написано, что драйвер перестал получать отклик от железа, из-за чего попытка прочитать данные не проходит. И есть вывод двух Xid кодов - 31 и 62. И если был только 31 - можно было бы грешить на драйвер. А 62 в сочетании с артефактами на экране - это гарантированная проблема с железом. Вникайте: https://docs.nvidia.com/deploy/xid-errors/index.html
Собственно, согласно таблице, 62 - зависание внутреннего микроконтроллера. HW Error или Thermal Issue (перегрев) указаны в качестве возможной причины. И повторяю еще раз - в сочетании с такими артефактами на экране - это не драйвер, как первопричина.

Вопрос к гуру

Добавлено: 14 окт 2020, 18:20
M_o_n_g_o_l
slant, Спасибо за участие. Буду ждать RTX 3070, видимо эта карта своё отжила, 5 лет исправно отработала.

Вопрос к гуру

Добавлено: 14 окт 2020, 18:25
WWolf
slant писал(а):
14 окт 2020, 18:17
HW Error или Thermal Issue (перегрев) указаны в качестве возможной причины.
как и Driver Error...
и причиной халта как раз может быть 31, которая и стопорит впоследствии контроллер...

M_o_n_g_o_l, поиграйся с версиями дров...

Вопрос к гуру

Добавлено: 14 окт 2020, 18:28
M_o_n_g_o_l
WWolf, Да вот только вчера поменял. Стоял 450.66, поставил свежий 450.80.02. И сегодня после почти двух часов простоя словил тоже самое... ((

Вопрос к гуру

Добавлено: 14 окт 2020, 19:29
WWolf
M_o_n_g_o_l, свободный драйвер так же себя ведёт?

Вопрос к гуру

Добавлено: 14 окт 2020, 23:35
M_o_n_g_o_l
WWolf, Свободный не ставил, только проприетарь.Да и выскакивает не постоянно, раз, два в месяц.

Вопрос к гуру

Добавлено: 15 окт 2020, 04:47
slant
WWolf писал(а):
14 окт 2020, 18:25
и причиной халта как раз может быть 31, которая и стопорит впоследствии контроллер...
В этом случае не было бы квадратов россыпью. Либо просто замершая картинка, либо один разрыв, похожий на тиринг, только в статике. В крайнем случае - несколько таких квадратов, но вместе одной полосой, хотя это уже 50 на 50 признак. А такая россыпь - аппаратная первопричина.

Вопрос к гуру

Добавлено: 15 окт 2020, 04:53
slant
M_o_n_g_o_l писал(а):
14 окт 2020, 18:20
slant, Спасибо за участие. Буду ждать RTX 3070, видимо эта карта своё отжила, 5 лет исправно отработала.
Но питание имеет смысл все-таки проверить. Если есть возможность, в идеале - заменой блока питания на заведомо исправный. Т.к. хоть шанс и небольшой, но есть вероятность что виноват именно он - т.к. вы говорите что происходит подобное в моменты без нагрузки. Вот если бы наоборот, в моменты пиковой нагрузки - там почти наверняка видюха сама по себе. А так, я встречал случаи, когда блок начинает неадекватно себя вести выдавать "грязное" питание именно без нагрузки. И влияло это в том числе и на видео.

Вопрос к гуру

Добавлено: 15 окт 2020, 04:58
symon2014
slant писал(а):
15 окт 2020, 04:53
в идеале - заменой блока питания
Я бы добавил к этому и кондёры фильтров на мамке.

Вопрос к гуру

Добавлено: 15 окт 2020, 07:49
WWolf
symon2014, гы, точно... Был случай Ворд вешал тачку намертво, а все игры того времени летали без сбоев - замена вздутых кондеров решило проблему....

Вопрос к гуру

Добавлено: 15 окт 2020, 07:51
WWolf
slant, ну как дефрагментация отобразится это бабка на двое сказала и в какую область свалится контроллер...

Вопрос к гуру

Добавлено: 15 окт 2020, 11:56
M_o_n_g_o_l
Всем спасибо за участие, будем посмотреть. Поехал я на дачу, отдохну с шашлычком и.т.д. последние тёплые деньки захватить. ))

Вопрос к гуру

Добавлено: 16 окт 2020, 11:34
Unborn
M_o_n_g_o_l писал(а):
15 окт 2020, 11:56
Всем спасибо за участие, будем посмотреть.
Посмотри. Может просто по питанию в экономию уходит без нагрузки, а обратно не выходит.

Вопрос к гуру

Добавлено: 04 ноя 2020, 13:49
M_o_n_g_o_l
Всем привет! Однако я всё же решил поупрямничать и продолжаю грешить на видеодрайвер и "космонавта"/что-то не то они там подкрутили/. Прошло три недели. Что имеем: MX Linux 19.2 KDE /Buster/, драйвер 450.66, как работал так и работает. Ни одного вылета. Kubuntu 20.04.1. Откатился аж на 435 видеодрайвер. И что вы думаете? Всё работает ни одного вылета и в помине не было. Всё таки это какой-то костыль с видеодрайвером, а не с железом. Всем спасибо! Наблюдаю дальше. ))

Вопрос к гуру

Добавлено: 04 ноя 2020, 13:50
M_o_n_g_o_l
P.S. А так же всех с Праздником!!! ))