abclinuxu.cz AbcLinuxu.cz itbiz.cz ITBiz.cz HDmag.cz HDmag.cz abcprace.cz AbcPráce.cz
AbcLinuxu hledá autory!
Inzerujte na AbcPráce.cz od 950 Kč
Rozšířené hledání
×
včera 10:55 | Komunita

Vše nejlepší k dnešnímu Software Freedom Day (SFD, Wikipedie).

Ladislav Hagara | Komentářů: 2
20.9. 17:55 | Komunita

V Berlíně probíhá do neděle linuxová konference All Systems Go! 2019. Na programu je řada zajímavých přednášek. Sledovat je lze online. Videozáznamy jsou k dispozici jak na media.ccc.de. Dění lze sledovat na Twitteru.

Ladislav Hagara | Komentářů: 0
20.9. 15:11 | Nová verze

Byla vydána nová stabilní verze 2.8 (2.8.1664.35) webového prohlížeče Vivaldi (Wikipedie). Přehled novinek v příspěvku na blogu. Z novinek vývojáři zdůrazňují synchronizaci s Vivaldi pro Android. Nejnovější Vivaldi je postaven na Chromiu 77.0.3865.78.

Ladislav Hagara | Komentářů: 16
19.9. 21:11 | Nová verze

Po půl roce vývoje od vydání verze 8.0.0 byla vydána verze 9.0.0 překladačové infrastruktury LLVM (Wikipedie). Přehled novinek v poznámkách k vydání: LLVM, Clang, Extra Clang Tools, LLD a Libc++. Vývojáři zdůrazňují podporu "asm goto", díky které lze pomocí Clangu přeložit například Linux pro x86_64 (CONFIG_JUMP_LABEL=y).

Ladislav Hagara | Komentářů: 10
19.9. 14:00 | Nová verze

Bylo vydáno Eclipse IDE 2019-09 aneb Eclipse 4.13. Představení novinek na YouTube. Vydána byla také nová verze 7 online IDE Eclipse Che.

Ladislav Hagara | Komentářů: 0
19.9. 11:11 | Nová verze

Byla vydána verze 24.0 svobodného softwaru OBS Studio (Open Broadcaster Software, Wikipedie) určeného pro streamování a nahrávání obrazovky počítače. Přehled novinek na GitHubu nebo pomocí krátkých videí na Twitteru.

Ladislav Hagara | Komentářů: 3
19.9. 11:00 | Komunita

Microsoft představil a pod licencí SIL Open Font License (OFL) na GitHubu zveřejnil font Cascadia Code. Font je určen především pro zobrazování textu v emulátorech terminálu a vývojových prostředích (Přehled fontů s pevnou šířkou).

Ladislav Hagara | Komentářů: 19
18.9. 21:11 | Zajímavý software

Souborový systém exFAT se běžně používá na paměťových médiích jako karty SDXC, ale z licenčních důvodů jej nebylo možné začlenit do Linuxu, ačkoliv v roce 2013 unikl ovladač od Samsungu, jak shrnuje článek na Linux Weekly News. Park Ju Hyung nedávno vzal novější verzi ovladače od Samsungu a založil na ní vlastní projekt exfat-linux, který je k dispozici uživatelům.

Fluttershy, yay! | Komentářů: 18
18.9. 05:55 | Pozvánky

Dnes a zítra pořádá Národní úřad pro kybernetickou a informační bezpečnost (NÚKIB) ve spolupráci se studentským portálem Security Outlines konferenci CyberCon Brno 2019. Sledovat ji lze také online.

Ladislav Hagara | Komentářů: 0
18.9. 04:44 | Nová verze

Byla vydána Java 13 / JDK 13. Nových vlastností (JEP - JDK Enhancement Proposal) je 5. Nová Java / JDK vychází každých 6 měsíců.

Ladislav Hagara | Komentářů: 2
Kdy jste naposledy viděli počítač s připojeným běžícím CRT monitorem?
 (20%)
 (3%)
 (11%)
 (37%)
 (27%)
 (2%)
Celkem 205 hlasů
 Komentářů: 21, poslední včera 09:11
Rozcestník

Dotaz: Změna IRQ pro komponentu

16.11.2018 19:50 Ariczek | skóre: 5
Změna IRQ pro komponentu
Přečteno: 614×
Zdravím,

řeším problém se zamrzáním PC, který nevím, zda je SW nebo HW.

OS je Ubuntu, trouble maker si myslím že je ovladač nvidia a 1050Ti karta. Pokud nemám nainstalovány žádné nvidia-driver-* (zkoušel jsem verze 396, 410 i 415), PC funguje OK. Ve chvíli kdy driver nainstaluju, počítač se stane v podstatě nepoužitelný, po nějaké relativně krátké době zcela zamrzne. Dokážu se ze stavu vyhrabat jen přes tvrdý reboot.

Záznam v syslogu říká:
irq 16: nobody cared (try booting with the "irqpoll" option)
Po troše googlení jsem narazil na stránku. Bohužel tato úprava nepomohla, stále dochází k zamrzání.

Po dalším zkoumání (bez nvidia ovladačů) jsem narazil na to, že irq 16 je použita u jiného zařízení:
user@PC:~$ sudo lshw | grep irq:16 -B11
        *-multimedia
             description: Audio device
             product: SBx00 Azalia (Intel HDA)
             vendor: Advanced Micro Devices, Inc. [AMD/ATI]
             physical id: 14.2
             bus info: pci@0000:00:14.2
             version: 40
             width: 64 bits
             clock: 33MHz
             capabilities: pm bus_master cap_list
             configuration: driver=snd_hda_intel latency=32
             resources: irq:16 memory:fe600000-fe603fff
Mám nějakou šanci, jak změnit irq u komponenty či jinak předejít té kolizi?

S pozdravem, Ariczek

Odpovědi

Josef Kufner avatar 16.11.2018 20:16 Josef Kufner | skóre: 69
Rozbalit Rozbalit vše Re: Změna IRQ pro komponentu
Možností hýbat s IRQ je pár a hodně záleží, co máš za hardware.

Mohlo by to jít nastavit v BIOSu. Možná. Některé, hlavně starší počítače, to tam měly. Integrovaná zařízení jde obvykle zakázat, tak bys alespoň mohl zkusit, zda to je konfliktem mezi nimi, nebo něčím jiným.

V dávných dobách byly po deskách různě rozmístěné jumpery, kterými se to dalo nastavovat. To už asi nebude moc aktuální.

Další možností by mohlo být přendání jedné z těch karet do sousedního slotu. Pokud je IRQ přiděleno drátem od slotu směrem k procesoru, tak by to v případě konfliktu asi pomohlo. Blbé je, že s Intel HDA se nějak šoupe blbě a na grafiku bývá jen jeden slot.

Existuje démon irqbalance, který asi nějak řekne chipsetu, jaké přerušení kam routovat. Nezkoumal jsem, jak to funguje, možná by si s tímto poradil.

Čím novější hardware, tím více autodetekce tam je. Když resetuješ konfiguraci, tak by se mohlo vše nadetekovat znovu a možná lépe. Na to by také mohlo pomoct nabootovat bez nějakých ostatních postradatelných komponent, zda se to při té autokonfiguraci neposbírá nějak lépe.

Ale asi bych začal aktualizací jádra a firmwaru. Těch pár balíčků můžeš zkusit prihodit z backportů či vývojové větve, neboť na jádře nic přímo nezávisí a zpětná kompatibilita se udržuje.
Hello world ! Segmentation fault (core dumped)
17.11.2018 09:04 Ariczek | skóre: 5
Rozbalit Rozbalit vše Re: Změna IRQ pro komponentu
Ohledně mého HW - je to přes 6 let starý PC, ve kterém odešla grafika. Jako náhradu jsem koupil právě tu 1050Ti.

Primární OS tu byl proprietární W10, ale ten nedokážu do použitelného (ne házejícího BSOD) stavu uvést vůbec. Ubuntu bez grafických ovladačů jede celkem OK.

Ideálně bych potřeboval najít řešení někde na úrovni BIOSu. Hádám že tohle bude i troublemaker na W.

Ohledně firmware, dmidecode říká:
BIOS Information
        Vendor: American Megatrends Inc.
        Version: 1604
        Release Date: 10/16/2012
Mám tu stažen novější M5A99X-EVO-ASUS-1708.zip, ale zatím jsem nepřišel na to jak ten .ROM uvnitř nainstalovat.

Verze kernelu není úplně stará:
root@PC:~# uname -r
4.15.0-39-generic
Celkově HW vypadá následovně:
root@PC:~# lshw -short
H/W path       Device     Class       Description
=================================================
                          system      To be filled by O.E.M. (To be filled by O.E.M.)
/0                        bus         M5A99X EVO
/0/0                      memory      64KiB BIOS
/0/4                      processor   AMD FX(tm)-8120 Eight-Core Processor
/0/4/5                    memory      384KiB L1 cache
/0/4/6                    memory      8MiB L2 cache
/0/4/7                    memory      8MiB L3 cache
/0/26                     memory      16GiB System Memory
/0/26/0                   memory      4GiB DIMM DDR3 Synchronous 1333 MHz (0.8 ns)
/0/26/1                   memory      4GiB DIMM DDR3 Synchronous 1333 MHz (0.8 ns)
/0/26/2                   memory      4GiB DIMM DDR3 Synchronous 1333 MHz (0.8 ns)
/0/26/3                   memory      4GiB DIMM DDR3 Synchronous 1333 MHz (0.8 ns)
/0/100                    bridge      RD9x0/RX980 Host Bridge
/0/100/2                  bridge      RD890/RD9x0/RX980 PCI to PCI bridge (PCI Express GFX port 0)
/0/100/2/0                display     GP107 [GeForce GTX 1050 Ti]
/0/100/2/0.1              multimedia  NVIDIA Corporation
/0/100/4                  bridge      RD890/RD9x0/RX980 PCI to PCI bridge (PCI Express GPP Port 0)
/0/100/4/0     enp2s0     network     RTL8111/8168/8411 PCI Express Gigabit Ethernet Controller
/0/100/5                  bridge      RD890/RD9x0/RX980 PCI to PCI bridge (PCI Express GPP Port 1)
/0/100/5/0                bus         ASM1042 SuperSpeed USB Host Controller
/0/100/5/0/0   usb8       bus         xHCI Host Controller
/0/100/5/0/1   usb9       bus         xHCI Host Controller
/0/100/6                  bridge      RD890/RD9x0/RX980 PCI to PCI bridge (PCI Express GPP Port 2)
/0/100/6/0                storage     JMB362 SATA Controller
/0/100/7                  bridge      RD890/RD9x0/RX980 PCI to PCI bridge (PCI Express GPP Port 3)
/0/100/7/0                bus         ASMedia Technology Inc.
/0/100/7/0/0   usb10      bus         xHCI Host Controller
/0/100/7/0/1   usb11      bus         xHCI Host Controller
/0/100/a                  bridge      RD890/RD9x0/RX980 PCI to PCI bridge (PCI Express GPP Port 5)
/0/100/a/0                storage     JMB362 SATA Controller
/0/100/11                 storage     SB7x0/SB8x0/SB9x0 SATA Controller [AHCI mode]
/0/100/12                 bus         SB7x0/SB8x0/SB9x0 USB OHCI0 Controller
/0/100/12/1    usb4       bus         OHCI PCI host controller
/0/100/12.2               bus         SB7x0/SB8x0/SB9x0 USB EHCI Controller
/0/100/12.2/1  usb1       bus         EHCI Host Controller
/0/100/13                 bus         SB7x0/SB8x0/SB9x0 USB OHCI0 Controller
/0/100/13/1    usb5       bus         OHCI PCI host controller
/0/100/13/1/3             input       USB Receiver
/0/100/13.2               bus         SB7x0/SB8x0/SB9x0 USB EHCI Controller
/0/100/13.2/1  usb2       bus         EHCI Host Controller
/0/100/14                 bus         SBx00 SMBus Controller
/0/100/14.2               multimedia  SBx00 Azalia (Intel HDA)
/0/100/14.3               bridge      SB7x0/SB8x0/SB9x0 LPC host controller
/0/100/14.4               bridge      SBx00 PCI to PCI Bridge
/0/100/14.4/6             bus         VT6306/7/8 [Fire II(M)] IEEE 1394 OHCI Controller
/0/100/14.5               bus         SB7x0/SB8x0/SB9x0 USB OHCI2 Controller
/0/100/14.5/1  usb6       bus         OHCI PCI host controller
/0/100/16                 bus         SB7x0/SB8x0/SB9x0 USB OHCI0 Controller
/0/100/16/1    usb7       bus         OHCI PCI host controller
/0/100/16.2               bus         SB7x0/SB8x0/SB9x0 USB EHCI Controller
/0/100/16.2/1  usb3       bus         EHCI Host Controller
/0/101                    bridge      Family 15h Processor Function 0
/0/102                    bridge      Family 15h Processor Function 1
/0/103                    bridge      Family 15h Processor Function 2
/0/104                    bridge      Family 15h Processor Function 3
/0/105                    bridge      Family 15h Processor Function 4
/0/106                    bridge      Family 15h Processor Function 5
/0/1           scsi1      storage     
/0/1/0.0.0     /dev/sda   disk        1TB ST31000524AS
/0/1/0.0.0/1   /dev/sda1  volume      931GiB EXT4 volume

root@PC:~# lspci
00:00.0 Host bridge: Advanced Micro Devices, Inc. [AMD/ATI] RD9x0/RX980 Host Bridge (rev 02)
00:02.0 PCI bridge: Advanced Micro Devices, Inc. [AMD/ATI] RD890/RD9x0/RX980 PCI to PCI bridge (PCI Express GFX port 0)
00:04.0 PCI bridge: Advanced Micro Devices, Inc. [AMD/ATI] RD890/RD9x0/RX980 PCI to PCI bridge (PCI Express GPP Port 0)
00:05.0 PCI bridge: Advanced Micro Devices, Inc. [AMD/ATI] RD890/RD9x0/RX980 PCI to PCI bridge (PCI Express GPP Port 1)
00:06.0 PCI bridge: Advanced Micro Devices, Inc. [AMD/ATI] RD890/RD9x0/RX980 PCI to PCI bridge (PCI Express GPP Port 2)
00:07.0 PCI bridge: Advanced Micro Devices, Inc. [AMD/ATI] RD890/RD9x0/RX980 PCI to PCI bridge (PCI Express GPP Port 3)
00:0a.0 PCI bridge: Advanced Micro Devices, Inc. [AMD/ATI] RD890/RD9x0/RX980 PCI to PCI bridge (PCI Express GPP Port 5)
00:11.0 SATA controller: Advanced Micro Devices, Inc. [AMD/ATI] SB7x0/SB8x0/SB9x0 SATA Controller [AHCI mode] (rev 40)
00:12.0 USB controller: Advanced Micro Devices, Inc. [AMD/ATI] SB7x0/SB8x0/SB9x0 USB OHCI0 Controller
00:12.2 USB controller: Advanced Micro Devices, Inc. [AMD/ATI] SB7x0/SB8x0/SB9x0 USB EHCI Controller
00:13.0 USB controller: Advanced Micro Devices, Inc. [AMD/ATI] SB7x0/SB8x0/SB9x0 USB OHCI0 Controller
00:13.2 USB controller: Advanced Micro Devices, Inc. [AMD/ATI] SB7x0/SB8x0/SB9x0 USB EHCI Controller
00:14.0 SMBus: Advanced Micro Devices, Inc. [AMD/ATI] SBx00 SMBus Controller (rev 42)
00:14.2 Audio device: Advanced Micro Devices, Inc. [AMD/ATI] SBx00 Azalia (Intel HDA) (rev 40)
00:14.3 ISA bridge: Advanced Micro Devices, Inc. [AMD/ATI] SB7x0/SB8x0/SB9x0 LPC host controller (rev 40)
00:14.4 PCI bridge: Advanced Micro Devices, Inc. [AMD/ATI] SBx00 PCI to PCI Bridge (rev 40)
00:14.5 USB controller: Advanced Micro Devices, Inc. [AMD/ATI] SB7x0/SB8x0/SB9x0 USB OHCI2 Controller
00:16.0 USB controller: Advanced Micro Devices, Inc. [AMD/ATI] SB7x0/SB8x0/SB9x0 USB OHCI0 Controller
00:16.2 USB controller: Advanced Micro Devices, Inc. [AMD/ATI] SB7x0/SB8x0/SB9x0 USB EHCI Controller
00:18.0 Host bridge: Advanced Micro Devices, Inc. [AMD] Family 15h Processor Function 0
00:18.1 Host bridge: Advanced Micro Devices, Inc. [AMD] Family 15h Processor Function 1
00:18.2 Host bridge: Advanced Micro Devices, Inc. [AMD] Family 15h Processor Function 2
00:18.3 Host bridge: Advanced Micro Devices, Inc. [AMD] Family 15h Processor Function 3
00:18.4 Host bridge: Advanced Micro Devices, Inc. [AMD] Family 15h Processor Function 4
00:18.5 Host bridge: Advanced Micro Devices, Inc. [AMD] Family 15h Processor Function 5
01:00.0 VGA compatible controller: NVIDIA Corporation GP107 [GeForce GTX 1050 Ti] (rev a1)
01:00.1 Audio device: NVIDIA Corporation GP107GL High Definition Audio Controller (rev a1)
02:00.0 Ethernet controller: Realtek Semiconductor Co., Ltd. RTL8111/8168/8411 PCI Express Gigabit Ethernet Controller (rev 06)
03:00.0 USB controller: ASMedia Technology Inc. ASM1042 SuperSpeed USB Host Controller
04:00.0 SATA controller: JMicron Technology Corp. JMB362 SATA Controller (rev 10)
05:00.0 USB controller: ASMedia Technology Inc. Device 1040
06:00.0 SATA controller: JMicron Technology Corp. JMB362 SATA Controller (rev 10)
07:06.0 FireWire (IEEE 1394): VIA Technologies, Inc. VT6306/7/8 [Fire II(M)] IEEE 1394 OHCI Controller (rev c0)

Josef Kufner avatar 17.11.2018 09:29 Josef Kufner | skóre: 69
Rozbalit Rozbalit vše Re: Změna IRQ pro komponentu
Otázkou je, jakým způsobem ta integrovaná grafika odešla. Pokud špatným, tak může dělat velké potíže, i když jí nechceš používat. V BIOSu bývá povolování a zakazování integrovaných komponent. Důkladně tam vše okolo integrované grafiky zakaž. Možná klidně zakaž úplně všecko a povol jen to, co opravdu potřebuješ k bootu. Pokud to pomůže, tak postupně povoluj další věci.
Hello world ! Segmentation fault (core dumped)
17.11.2018 09:37 Ariczek | skóre: 5
Rozbalit Rozbalit vše Re: Změna IRQ pro komponentu
Není žádná integrovaná grafika - AMD FX8120 ji nemá. Měl jsem tam kartu Radeon tuším 6950 původně.
Josef Kufner avatar 17.11.2018 09:41 Josef Kufner | skóre: 69
Rozbalit Rozbalit vše Re: Změna IRQ pro komponentu
Aha, tak to pak nemělo dělat potíže. Škrtni si tak třetinu toho, co jsem psal ;-)
Hello world ! Segmentation fault (core dumped)
16.11.2018 23:28 pc2005 | skóre: 38 | blog: GardenOfEdenConfiguration | liberec
Rozbalit Rozbalit vše Re: Změna IRQ pro komponentu
Legacy IRQ se dá nastavit manuálně před načtením driveru v konfiguračních registrech PCI "Interrupt Line". Například pomocí programu setpci. Ale je to hodně špinavé řešení. A nevím jak moc dobře to na x86/acpi funguje.

Systém ti nabízí použití volby irqpoll. Zkus jí. Dneska by měly drivery používat MSI a ne legacy IRQ (PCIe byla s tím založená a dneska už moderní karty problém s MSI snad nemaj, leda tak HW před 10 lety).

Z kernelu dále by mohla pomoct volba irqfixup, volby pro APIC (reroute apod) a možná pci rescan. Projdi si tenhle dokument.

Ještě bys sem mohl hodit výpis příkazu
modinfo nvidia
(jestli se tedy driver jmenuje nvidia.ko, měl by), který vypíše všechny volby toho binárního blobu. Občas se najde nějaká zajímavá volba co to opraví (zrovna tenhle týden se díky volbám z modulu amdgpu rozchodil radeon na superobstarožním HW, který nepodporuje nějaké řízení spotřeby či co).

Obecně vzato už roky a roky by linuxový driver neměl mít problém se sdíleným IRQ. Mechanismus funguje tak, že se driver koukne zda přerušení bylo vyvoláno jím spravovaným hardwarem a pokud jo, tak ho obslouží. Pokud ne, tak vrátí kód "já ne". U opensource kódu bych se kouknul do zdrojáků. U nvidia blobu to jaksi moc nepůjde (i když mám dojem, že si to kompiluje nějaký antiGPL wrappery).

Osobně bych ale řekl, že tam bude ještě nějaky další problém. Ne jenom to IRQ. Takže nejlepší bude nahlásit chybu nvidii a pokud to nvidie neopraví do nějaké uspokojivé doby, tak jí v budoucnu vyjádřit nespokojenost svojí peněženkou ;-).
17.11.2018 09:09 Ariczek | skóre: 5
Rozbalit Rozbalit vše Re: Změna IRQ pro komponentu
Mechanismus funguje tak, že se driver koukne zda přerušení bylo vyvoláno jím spravovaným hardwarem a pokud jo, tak ho obslouží. Pokud ne, tak vrátí kód "já ne".
Hádám, že tohle se stane - že všechny drivery řeknou že to není pro ně.
Osobně bych ale řekl, že tam bude ještě nějaky další problém.
Jo, to já si myslím (i k okolnostem co píšu výše v komentu) taky, jen mě mate, že jediným rozdílem mezi "poměrně fungující" a "nepoužitelné" je zavedení driverů nvidia.

Na ty ostatní body jdu kouknut do "nestabilního" světa. Díky.
17.11.2018 10:29 Ariczek | skóre: 5
Rozbalit Rozbalit vše Re: Změna IRQ pro komponentu
Dávám výpis příkazu:
root@PC:~# modinfo nvidia
filename:       /lib/modules/4.15.0-39-generic/updates/dkms/nvidia.ko
alias:          char-major-195-*
version:        415.13
supported:      external
license:        NVIDIA
srcversion:     FF48FAE0310141F01CD81A8
alias:          pci:v000010DEd00000E00sv*sd*bc04sc80i00*
alias:          pci:v000010DEd*sv*sd*bc03sc02i00*
alias:          pci:v000010DEd*sv*sd*bc03sc00i00*
depends:        ipmi_msghandler
retpoline:      Y
name:           nvidia
vermagic:       4.15.0-39-generic SMP mod_unload 
parm:           NvSwitchRegDwords:NvSwitch regkey (charp)
parm:           NVreg_Mobile:int
parm:           NVreg_ResmanDebugLevel:int
parm:           NVreg_RmLogonRC:int
parm:           NVreg_ModifyDeviceFiles:int
parm:           NVreg_DeviceFileUID:int
parm:           NVreg_DeviceFileGID:int
parm:           NVreg_DeviceFileMode:int
parm:           NVreg_UpdateMemoryTypes:int
parm:           NVreg_InitializeSystemMemoryAllocations:int
parm:           NVreg_UsePageAttributeTable:int
parm:           NVreg_MapRegistersEarly:int
parm:           NVreg_RegisterForACPIEvents:int
parm:           NVreg_CheckPCIConfigSpace:int
parm:           NVreg_EnablePCIeGen3:int
parm:           NVreg_EnableMSI:int
parm:           NVreg_TCEBypassMode:int
parm:           NVreg_UseThreadedInterrupts:int
parm:           NVreg_EnableStreamMemOPs:int
parm:           NVreg_EnableBacklightHandler:int
parm:           NVreg_EnableUserNUMAManagement:int
parm:           NVreg_MemoryPoolSize:int
parm:           NVreg_KMallocHeapMaxSize:int
parm:           NVreg_VMallocHeapMaxSize:int
parm:           NVreg_IgnoreMMIOCheck:int
parm:           NVreg_RegistryDwords:charp
parm:           NVreg_RegistryDwordsPerDevice:charp
parm:           NVreg_RmMsg:charp
parm:           NVreg_GpuBlacklist:charp
parm:           NVreg_AssignGpus:charp

root@PC:~# lsmod | grep nvidia
nvidia_uvm            786432  0
nvidia_drm             40960  7
nvidia_modeset       1036288  13 nvidia_drm
nvidia              17227776  581 nvidia_uvm,nvidia_modeset
drm_kms_helper        172032  1 nvidia_drm
drm                   401408  10 drm_kms_helper,nvidia_drm
ipmi_msghandler        53248  2 ipmi_devintf,nvidia
17.11.2018 20:21 pc2005 | skóre: 38 | blog: GardenOfEdenConfiguration | liberec
Rozbalit Rozbalit vše Re: Změna IRQ pro komponentu
Ještě můžeš zkusit to MSI naopak vypnout :-D. BTW tohle taky zasahuje do přerušení "NVreg_UseThreadedInterrupts".
17.11.2018 09:34 dustin | skóre: 62 | blog: dustin
Rozbalit Rozbalit vše Re: Změna IRQ pro komponentu
Dle https://wiki.gentoo.org/wiki/NVidia/nvidia-drivers/en#Driver_fails_to_initialize_when_MSI_interrupts_are_enabled mají nvidia drivery MSI defaultně zapnuté. Ten link to také zapíná, možná proto to nemá žádný vliv.

Zkusil bych naopak MSI vypnout. A určitě si nějak ověřuj, že se změna opravdu provede, než dojde k záhryzu. Třeba nějakým skriptem spuštěným hned po startu, ve smyčce do perzistentního souboru mezi booty (tedy ne /tmp u distribucí, které je mažou mezi booty.

A taky bych vypsal obsah /proc/interrupts, než se to hryzne, zda bys z toho něco vykoukal. Očividně nemá nvidií driver rád sdílení IRQ.
17.11.2018 21:06 Ariczek | skóre: 5
Rozbalit Rozbalit vše Re: Změna IRQ pro komponentu
Tu stránku chápu právě tak, že se zapne MSI - a tím se vypne přímo irq a nebude již sdíleno...
17.11.2018 16:19 Ariczek | skóre: 5
Rozbalit Rozbalit vše Re: Změna IRQ pro komponentu
Hm, tak asi bych měl dotaz ohledně irq označit za vyřešený, ale stejně PC zamrzá...

Udělal jsem update BIOS na poslední verzi:
	Vendor: American Megatrends Inc.
	Version: 1708
	Release Date: 04/10/2013
V BIOSu jsem vypnul zařízení Azalia. Hláška "nobody cared" se už v syslogu neukáže.

Nicméně k zamrznutí stejně dojde, akorát teď zatím netuším, čeho se mám chytnout.

K zamrznutí došlo v 15:36 (ten čas svítil na displeji), pro ten čas je v syslogu následující:
Nov 17 15:36:08 PC /usr/lib/gdm3/gdm-x-session[1275]: (--) NVIDIA(GPU-0): Samsung SA300/350/360 (DFP-0): connected
Nov 17 15:36:08 PC /usr/lib/gdm3/gdm-x-session[1275]: (--) NVIDIA(GPU-0): Samsung SA300/350/360 (DFP-0): Internal TMDS
Nov 17 15:36:08 PC /usr/lib/gdm3/gdm-x-session[1275]: (--) NVIDIA(GPU-0): Samsung SA300/350/360 (DFP-0): 600.0 MHz maximum pixel clock
Nov 17 15:36:08 PC /usr/lib/gdm3/gdm-x-session[1275]: (--) NVIDIA(GPU-0):
Nov 17 15:36:08 PC /usr/lib/gdm3/gdm-x-session[1275]: (--) NVIDIA(GPU-0): DFP-1: disconnected
Nov 17 15:36:08 PC /usr/lib/gdm3/gdm-x-session[1275]: (--) NVIDIA(GPU-0): DFP-1: Internal TMDS
Nov 17 15:36:08 PC /usr/lib/gdm3/gdm-x-session[1275]: (--) NVIDIA(GPU-0): DFP-1: 165.0 MHz maximum pixel clock
Nov 17 15:36:08 PC /usr/lib/gdm3/gdm-x-session[1275]: (--) NVIDIA(GPU-0):
Nov 17 15:36:08 PC /usr/lib/gdm3/gdm-x-session[1275]: (--) NVIDIA(GPU-0): DFP-2: disconnected
Nov 17 15:36:08 PC /usr/lib/gdm3/gdm-x-session[1275]: (--) NVIDIA(GPU-0): DFP-2: Internal DisplayPort
Nov 17 15:36:08 PC /usr/lib/gdm3/gdm-x-session[1275]: (--) NVIDIA(GPU-0): DFP-2: 1440.0 MHz maximum pixel clock
Nov 17 15:36:08 PC /usr/lib/gdm3/gdm-x-session[1275]: (--) NVIDIA(GPU-0):
Nov 17 15:36:08 PC /usr/lib/gdm3/gdm-x-session[1275]: (--) NVIDIA(GPU-0): DFP-3: disconnected
Nov 17 15:36:08 PC /usr/lib/gdm3/gdm-x-session[1275]: (--) NVIDIA(GPU-0): DFP-3: Internal TMDS
Nov 17 15:36:08 PC /usr/lib/gdm3/gdm-x-session[1275]: (--) NVIDIA(GPU-0): DFP-3: 165.0 MHz maximum pixel clock
Nov 17 15:36:08 PC /usr/lib/gdm3/gdm-x-session[1275]: (--) NVIDIA(GPU-0):
Nov 17 15:36:08 PC /usr/lib/gdm3/gdm-x-session[1275]: (--) NVIDIA(GPU-0): DFP-4: disconnected
Nov 17 15:36:08 PC /usr/lib/gdm3/gdm-x-session[1275]: (--) NVIDIA(GPU-0): DFP-4: Internal TMDS
Nov 17 15:36:08 PC /usr/lib/gdm3/gdm-x-session[1275]: (--) NVIDIA(GPU-0): DFP-4: 330.0 MHz maximum pixel clock
Nov 17 15:36:08 PC /usr/lib/gdm3/gdm-x-session[1275]: (--) NVIDIA(GPU-0):
Nov 17 15:36:10 PC gnome-shell[1411]: [AppIndicatorSupport-DEBUG] Registering StatusNotifierItem :1.87/org/ayatana/NotificationItem/steam
Nov 17 15:36:14 PC /usr/lib/gdm3/gdm-x-session[1275]: (--) NVIDIA(GPU-0): Samsung SA300/350/360 (DFP-0): connected
Nov 17 15:36:14 PC /usr/lib/gdm3/gdm-x-session[1275]: (--) NVIDIA(GPU-0): Samsung SA300/350/360 (DFP-0): Internal TMDS
Nov 17 15:36:14 PC /usr/lib/gdm3/gdm-x-session[1275]: (--) NVIDIA(GPU-0): Samsung SA300/350/360 (DFP-0): 600.0 MHz maximum pixel clock
Nov 17 15:36:14 PC /usr/lib/gdm3/gdm-x-session[1275]: (--) NVIDIA(GPU-0):
Nov 17 15:36:14 PC /usr/lib/gdm3/gdm-x-session[1275]: (--) NVIDIA(GPU-0): DFP-1: disconnected
Nov 17 15:36:14 PC /usr/lib/gdm3/gdm-x-session[1275]: (--) NVIDIA(GPU-0): DFP-1: Internal TMDS
Nov 17 15:36:14 PC /usr/lib/gdm3/gdm-x-session[1275]: (--) NVIDIA(GPU-0): DFP-1: 165.0 MHz maximum pixel clock
Nov 17 15:36:14 PC /usr/lib/gdm3/gdm-x-session[1275]: (--) NVIDIA(GPU-0):
Nov 17 15:36:14 PC /usr/lib/gdm3/gdm-x-session[1275]: (--) NVIDIA(GPU-0): DFP-2: disconnected
Nov 17 15:36:14 PC /usr/lib/gdm3/gdm-x-session[1275]: (--) NVIDIA(GPU-0): DFP-2: Internal DisplayPort
Nov 17 15:36:14 PC /usr/lib/gdm3/gdm-x-session[1275]: (--) NVIDIA(GPU-0): DFP-2: 1440.0 MHz maximum pixel clock
Nov 17 15:36:14 PC /usr/lib/gdm3/gdm-x-session[1275]: (--) NVIDIA(GPU-0):
Nov 17 15:36:14 PC /usr/lib/gdm3/gdm-x-session[1275]: (--) NVIDIA(GPU-0): DFP-3: disconnected
Nov 17 15:36:14 PC /usr/lib/gdm3/gdm-x-session[1275]: (--) NVIDIA(GPU-0): DFP-3: Internal TMDS
Nov 17 15:36:14 PC /usr/lib/gdm3/gdm-x-session[1275]: (--) NVIDIA(GPU-0): DFP-3: 165.0 MHz maximum pixel clock
Nov 17 15:36:14 PC /usr/lib/gdm3/gdm-x-session[1275]: (--) NVIDIA(GPU-0):
Nov 17 15:36:14 PC /usr/lib/gdm3/gdm-x-session[1275]: (--) NVIDIA(GPU-0): DFP-4: disconnected
Nov 17 15:36:14 PC /usr/lib/gdm3/gdm-x-session[1275]: (--) NVIDIA(GPU-0): DFP-4: Internal TMDS
Nov 17 15:36:14 PC /usr/lib/gdm3/gdm-x-session[1275]: (--) NVIDIA(GPU-0): DFP-4: 330.0 MHz maximum pixel clock
Nov 17 15:36:14 PC /usr/lib/gdm3/gdm-x-session[1275]: (--) NVIDIA(GPU-0):
Nov 17 15:36:52 PC kernel: [  408.993044] NVRM: GPU at PCI:0000:01:00: GPU-29cefe64-549a-0429-9f52-67763574938b
Nov 17 15:36:52 PC kernel: [  408.993050] NVRM: GPU Board Serial Number: 
Nov 17 15:36:52 PC kernel: [  408.993057] NVRM: Xid (PCI:0000:01:00): 16, Head 00000000 Count 00009fd4
Nov 17 15:36:53 PC kernel: [  410.017212] NVRM: Xid (PCI:0000:01:00): 8, Channel 00000028
Nov 17 15:37:01 PC kernel: [  418.209302] NVRM: Xid (PCI:0000:01:00): 8, Channel 00000020
Nov 17 15:37:06 PC kernel: [  423.361191] NVRM: Xid (PCI:0000:01:00): 16, Head 00000000 Count 00009fe2
Nov 17 15:37:16 PC kernel: [  433.601311] NVRM: Xid (PCI:0000:01:00): 16, Head 00000000 Count 00009fe9
Nov 17 15:37:27 PC kernel: [  443.841333] NVRM: Xid (PCI:0000:01:00): 16, Head 00000000 Count 00009fee
Nov 17 15:37:37 PC kernel: [  454.081434] NVRM: Xid (PCI:0000:01:00): 16, Head 00000000 Count 00009ff4
Nov 17 15:37:45 PC kernel: [  462.273597] NVRM: Xid (PCI:0000:01:00): 16, Head 00000000 Count 00009ff5
17.11.2018 20:40 pc2005 | skóre: 38 | blog: GardenOfEdenConfiguration | liberec
Rozbalit Rozbalit vše Re: Změna IRQ pro komponentu
Hele tohle naopak s přerušením souvisí. Sice nemusí být ty errory s přerušením zdroj chyby ale jen symptom, ale souviset to IMO bude. BTW chování, kdy je na jednom přerušení jen jedno zařízení se může teoreticky zpracovávat jinak (a hláška nebude vypisována).

Poslední řádky logu bude nějaké hlášení o obsazenosti nějakého FIFO na komunikaci s jádry na GPU. "Head" bude start platných dat a "Count" obsazenost té fronty. Jak vidíš, tak obsazenost roste a na hodnotě nejspíš 0x9fff se to zasekne. Vypadá to, že maximální délka té fronty bude 0xa000. Zároveň to vypadá, že nic z té fronty není odebíráno, protože to by pak rostla i "Head" hodnota. Obvykle jsou nová data ve frontě oznamována přerušením, takže pokud to přerušení něco ignoruje, tak nic ty data nebude odebírat.

Je to teda jen hypotéza, ale něco podobnýho dělala i nějaká prehistorická ATI radeon (se kterým jsem si tuhle hrál) a ručně se jí vypne IRQ (její opensource driver má ale dost ochranných mechanismů aby se nesekl systém).

Jestli to pravidelně mrzne do třeba 10 minut, tak zkus ukládat výpisy z /proc/interrupts. Podle zběžného pohledu do kernelu by tam měly být obrovské hodnoty u spurious interrupts (ta hláška ze začátku se vypíše snad až při 10k ignorovanejch přerušení).

P.S. Sice tohle je jen hypotéza, ale alespoň by to mohlo pomoct při nahlašování té chyby nějakému maintaineru nvidia blobu.
17.11.2018 22:22 Ariczek | skóre: 5
Rozbalit Rozbalit vše Re: Změna IRQ pro komponentu
Tak teď se mi to chovalo divně víc než obvykle. Nejdřív to běželo dlouho (cca 15 minut) bez problému, pak to zamrzlo ještě 2x (myš se mi většinou hýbe ale OS nereaguje).

První zámrz byl ve 21:39. Syslog končí zmáčknutím reset.
Nov 17 21:38:31 PC org.gnome.Shell.desktop[1563]: Window manager warning: Buggy client sent a _NET_ACTIVE_WINDOW message with a timestamp of 0 for 0x2400010 (Prison Arc)
Nov 17 21:39:01 PC CRON[3802]: (root) CMD (  [ -x /usr/lib/php/sessionclean ] && if [ ! -d /run/systemd/system ]; then /usr/lib/php/sessionclean; fi)
Nov 17 21:39:14 PC kernel: [  864.650726] NVRM: GPU at PCI:0000:01:00: GPU-29cefe64-549a-0429-9f52-67763574938b
Nov 17 21:39:14 PC kernel: [  864.650729] NVRM: GPU Board Serial Number: 
Nov 17 21:39:14 PC kernel: [  864.650731] NVRM: Xid (PCI:0000:01:00): 8, Channel 00000040
Nov 17 21:39:25 PC systemd[1]: Starting Clean php session files...
Nov 17 21:39:25 PC systemd[1]: Started Clean php session files.
Nov 17 21:39:26 PC kernel: [  877.002768] NVRM: Xid (PCI:0000:01:00): 16, Head 00000000 Count 000171cc
Nov 17 21:39:31 PC /usr/lib/gdm3/gdm-x-session[1427]: (II) event5  - Logitech M705: SYN_DROPPED event - some input events have been lost.
Nov 17 21:40:25 PC systemd[1]: Starting Cleanup of Temporary Directories...
Nov 17 21:40:25 PC systemd[1]: Started Cleanup of Temporary Directories.
Nov 17 21:40:45 PC /usr/lib/gdm3/gdm-x-session[1427]: (EE) NVIDIA(0): The NVIDIA X driver has encountered an error; attempting to
Nov 17 21:40:45 PC /usr/lib/gdm3/gdm-x-session[1427]: (EE) NVIDIA(0):     recover...
Nov 17 21:40:45 PC kernel: [  955.852043] NVRM: Xid (PCI:0000:01:00): 8, Channel 00000018
Nov 17 21:40:47 PC kernel: [  957.851813] NVRM: os_schedule: Attempted to yield the CPU while in atomic or interrupt context
Nov 17 21:40:49 PC kernel: [  959.851907] NVRM: os_schedule: Attempted to yield the CPU while in atomic or interrupt context
Nov 17 21:40:49 PC /usr/lib/gdm3/gdm-x-session[1427]: (II) event5  - Logitech M705: SYN_DROPPED event - some input events have been lost.
Nov 17 21:40:52 PC kernel: [  962.858950] nvidia-modeset: WARNING: GPU:0: Lost display notification (0:0x00000000); continuing.
Nov 17 21:40:57 PC kernel: [  968.268098] NVRM: Xid (PCI:0000:01:00): 8, Channel 0000001a
Nov 17 21:40:59 PC kernel: [  970.268029] NVRM: os_schedule: Attempted to yield the CPU while in atomic or interrupt context
Nov 17 21:41:01 PC kernel: [  972.268007] NVRM: os_schedule: Attempted to yield the CPU while in atomic or interrupt context
Nov 17 21:41:08 PC kernel: [  978.508189] NVRM: Xid (PCI:0000:01:00): 16, Head 00000000 Count 00017557
Nov 17 21:41:10 PC kernel: [  980.556366] NVRM: Xid (PCI:0000:01:00): 8, Channel 0000001a
Nov 17 21:41:12 PC kernel: [  982.556134] NVRM: os_schedule: Attempted to yield the CPU while in atomic or interrupt context
Nov 17 21:41:14 PC kernel: [  984.556163] NVRM: os_schedule: Attempted to yield the CPU while in atomic or interrupt context
Nov 17 21:41:22 PC kernel: [  992.844537] NVRM: Xid (PCI:0000:01:00): 8, Channel 0000001a
Nov 17 21:41:24 PC kernel: [  994.844296] NVRM: os_schedule: Attempted to yield the CPU while in atomic or interrupt context
Nov 17 21:41:26 PC kernel: [  996.844334] NVRM: os_schedule: Attempted to yield the CPU while in atomic or interrupt context
Nov 17 21:41:34 PC kernel: [ 1005.136550] NVRM: Xid (PCI:0000:01:00): 8, Channel 0000001a
Nov 17 21:41:36 PC kernel: [ 1007.136452] NVRM: os_schedule: Attempted to yield the CPU while in atomic or interrupt context
Nov 17 21:41:38 PC kernel: [ 1009.136482] NVRM: os_schedule: Attempted to yield the CPU while in atomic or interrupt context
Nov 17 21:41:46 PC kernel: [ 1017.420880] NVRM: Xid (PCI:0000:01:00): 8, Channel 0000001a
Nov 17 21:41:48 PC kernel: [ 1019.420673] NVRM: os_schedule: Attempted to yield the CPU while in atomic or interrupt context
Nov 17 21:41:50 PC kernel: [ 1021.420703] NVRM: os_schedule: Attempted to yield the CPU while in atomic or interrupt context
Nov 17 21:41:59 PC kernel: [ 1029.708889] NVRM: Xid (PCI:0000:01:00): 8, Channel 0000001a
Nov 17 21:42:01 PC kernel: [ 1031.708772] NVRM: os_schedule: Attempted to yield the CPU while in atomic or interrupt context
Nov 17 21:42:03 PC kernel: [ 1033.708800] NVRM: os_schedule: Attempted to yield the CPU while in atomic or interrupt context
Nov 17 21:42:11 PC kernel: [ 1041.997173] NVRM: Xid (PCI:0000:01:00): 8, Channel 0000001a
K tomuhle mám /proc/interrupts vývoj vždy po 20s, poslední se udělal někdy 21:41. Spurious nejsou.
            CPU0       CPU1       CPU2       CPU3       CPU4       CPU5       CPU6       CPU7       
   0:         35          0          0          0          0          0          0          0   IO-APIC    2-edge      timer
   8:          1          0          0          0          0          0          0          0   IO-APIC    8-edge      rtc0
   9:          0          0          0          0          0          0          0          0   IO-APIC    9-fasteoi   acpi
  17:          0          0          0          0          0          0          0          0   IO-APIC   17-fasteoi   ehci_hcd:usb1
  18:          0          0          0          0          0          2          0          0   IO-APIC   18-fasteoi   ohci_hcd:usb4, ohci_hcd:usb6
  19:          0      36833          0          0          0          0          0          0   IO-APIC   19-fasteoi   ahci[0000:00:11.0]
  20:        257          0          0          0      20326          0       2100          0   IO-APIC   20-fasteoi   ohci_hcd:usb5
  21:          0          0          0          3          0          0          0          0   IO-APIC   21-fasteoi   ehci_hcd:usb2, firewire_ohci
  22:          0          0          0          0          0          0          0          1   IO-APIC   22-fasteoi   ohci_hcd:usb7
  23:          0          0          0          0          0          0          0          0   IO-APIC   23-fasteoi   ehci_hcd:usb3
  28:          0          0          0          0          0          0          0          0   PCI-MSI 1572864-edge      xhci_hcd
  29:          0          0          0          0          0          0          0          0   PCI-MSI 1572865-edge      xhci_hcd
  30:          0          0          0          0          0          0          0          0   PCI-MSI 1572866-edge      xhci_hcd
  31:          0          0          0          0          0          0          0          0   PCI-MSI 1572867-edge      xhci_hcd
  32:          0          0          0          0          0          0          0          0   PCI-MSI 1572868-edge      xhci_hcd
  33:          0          0          0          0          0          0          0          0   PCI-MSI 1572869-edge      xhci_hcd
  34:          0          0          0          0          0          0          0          0   PCI-MSI 1572870-edge      xhci_hcd
  35:          0          0          0          0          0          0          0          0   PCI-MSI 1572871-edge      xhci_hcd
  37:          0          0          0          0          0          0          0          0   PCI-MSI 2621440-edge      xhci_hcd
  38:          0          0          0          0          0          0          0          0   PCI-MSI 2621441-edge      xhci_hcd
  39:          0          0          0          0          0          0          0          0   PCI-MSI 2621442-edge      xhci_hcd
  40:          0          0          0          0          0          0          0          0   PCI-MSI 2621443-edge      xhci_hcd
  41:          0          0          0          0          0          0          0          0   PCI-MSI 2621444-edge      xhci_hcd
  42:          0          0          0          0          0          0          0          0   PCI-MSI 2621445-edge      xhci_hcd
  43:          0          0          0          0          0          0          0          0   PCI-MSI 2621446-edge      xhci_hcd
  44:          0          0          0          0          0          0          0          0   PCI-MSI 2621447-edge      xhci_hcd
  46:          0          0          0          0          0        180          0      41741   PCI-MSI 1048576-edge      enp2s0
  47:          0          0          0          0          0          0          0          0   IO-APIC   27-fasteoi   ahci[0000:04:00.0]
  48:          0          0          0          0          0          0          0          0   IO-APIC   23-fasteoi   ahci[0000:06:00.0]
  50:          0          0          0          0         79          0          0          0   IO-APIC    1-fasteoi   snd_hda_intel:card0
  51:          0          0          0          0          0      88539         35          0   PCI-MSI 524288-edge      nvidia
 NMI:          9          8         16         10         13          9         13          8   Non-maskable interrupts
 LOC:     102245      71071     109590      56051     103830      48698     106425      60217   Local timer interrupts
 SPU:          0          0          0          0          0          0          0          0   Spurious interrupts
 PMI:          9          8         16         10         13          9         13          8   Performance monitoring interrupts
 IWI:      57076      39080      52083      31024      52377      61818      52029      32756   IRQ work interrupts
 RTR:          0          0          0          0          0          0          0          0   APIC ICR read retries
 RES:     298806     182894     265325     175879     235272     145990     250845     171069   Rescheduling interrupts
 CAL:      42992      25522      38136      29036      41245      28318      39200      28582   Function call interrupts
 TLB:      40024      23042      35540      25928      38285      25226      36236      25624   TLB shootdowns
 TRM:          0          0          0          0          0          0          0          0   Thermal event interrupts
 THR:          0          0          0          0          0          0          0          0   Threshold APIC interrupts
 DFR:          0          0          0          0          0          0          0          0   Deferred Error APIC interrupts
 MCE:          0          0          0          0          0          0          0          0   Machine check exceptions
 MCP:          4          4          4          4          4          4          4          4   Machine check polls
 HYP:          0          0          0          0          0          0          0          0   Hypervisor callback interrupts
 ERR:         49
 MIS:          0
 PIN:          0          0          0          0          0          0          0          0   Posted-interrupt notification event
 NPI:          0          0          0          0          0          0          0          0   Nested posted-interrupt event
 PIW:          0          0          0          0          0          0          0          0   Posted-interrupt wakeup event
K druhýmu zamrznutí došlo někde ve 21:44, dřív než jsem vůbec stihnul si vzít logy. Níže opět do hard resetu:
Nov 17 21:44:00 PC /usr/lib/gdm3/gdm-x-session[986]: (--) NVIDIA(GPU-0): Samsung SA300/350/360 (DFP-0): connected
Nov 17 21:44:00 PC /usr/lib/gdm3/gdm-x-session[986]: (--) NVIDIA(GPU-0): Samsung SA300/350/360 (DFP-0): Internal TMDS
Nov 17 21:44:00 PC /usr/lib/gdm3/gdm-x-session[986]: (--) NVIDIA(GPU-0): Samsung SA300/350/360 (DFP-0): 600.0 MHz maximum pixel clock
Nov 17 21:44:00 PC /usr/lib/gdm3/gdm-x-session[986]: (--) NVIDIA(GPU-0):
Nov 17 21:44:00 PC /usr/lib/gdm3/gdm-x-session[986]: (--) NVIDIA(GPU-0): DFP-1: disconnected
Nov 17 21:44:00 PC /usr/lib/gdm3/gdm-x-session[986]: (--) NVIDIA(GPU-0): DFP-1: Internal TMDS
Nov 17 21:44:00 PC /usr/lib/gdm3/gdm-x-session[986]: (--) NVIDIA(GPU-0): DFP-1: 165.0 MHz maximum pixel clock
Nov 17 21:44:00 PC /usr/lib/gdm3/gdm-x-session[986]: (--) NVIDIA(GPU-0):
Nov 17 21:44:00 PC /usr/lib/gdm3/gdm-x-session[986]: (--) NVIDIA(GPU-0): DFP-2: disconnected
Nov 17 21:44:00 PC /usr/lib/gdm3/gdm-x-session[986]: (--) NVIDIA(GPU-0): DFP-2: Internal DisplayPort
Nov 17 21:44:00 PC /usr/lib/gdm3/gdm-x-session[986]: (--) NVIDIA(GPU-0): DFP-2: 1440.0 MHz maximum pixel clock
Nov 17 21:44:00 PC /usr/lib/gdm3/gdm-x-session[986]: (--) NVIDIA(GPU-0):
Nov 17 21:44:00 PC /usr/lib/gdm3/gdm-x-session[986]: (--) NVIDIA(GPU-0): DFP-3: disconnected
Nov 17 21:44:00 PC /usr/lib/gdm3/gdm-x-session[986]: (--) NVIDIA(GPU-0): DFP-3: Internal TMDS
Nov 17 21:44:00 PC /usr/lib/gdm3/gdm-x-session[986]: (--) NVIDIA(GPU-0): DFP-3: 165.0 MHz maximum pixel clock
Nov 17 21:44:00 PC /usr/lib/gdm3/gdm-x-session[986]: (--) NVIDIA(GPU-0):
Nov 17 21:44:00 PC /usr/lib/gdm3/gdm-x-session[986]: (--) NVIDIA(GPU-0): DFP-4: disconnected
Nov 17 21:44:00 PC /usr/lib/gdm3/gdm-x-session[986]: (--) NVIDIA(GPU-0): DFP-4: Internal TMDS
Nov 17 21:44:00 PC /usr/lib/gdm3/gdm-x-session[986]: (--) NVIDIA(GPU-0): DFP-4: 330.0 MHz maximum pixel clock
Nov 17 21:44:00 PC /usr/lib/gdm3/gdm-x-session[986]: (--) NVIDIA(GPU-0):
Nov 17 21:44:18 PC systemd[1]: Starting Stop ureadahead data collection...
Nov 17 21:44:18 PC systemd[1]: Started Stop ureadahead data collection.
Nov 17 21:44:18 PC kernel: [   85.175289] logitech-hidpp-device 0003:046D:2011.0005: HID++ 1.0 device connected.
Nov 17 21:44:19 PC upowerd[898]: treating change event as add on /sys/devices/pci0000:00/0000:00:13.0/usb5/5-3/5-3:1.2/0003:046D:C52B.0003/0003:046D:2011.0005/power_supply/hidpp_battery_1
Nov 17 21:44:19 PC /usr/lib/gdm3/gdm-x-session[986]: (**) Option "fd" "39"
Nov 17 21:44:19 PC /usr/lib/gdm3/gdm-x-session[986]: (II) event1  - Power Button: device removed
Nov 17 21:44:19 PC /usr/lib/gdm3/gdm-x-session[986]: (**) Option "fd" "42"
Nov 17 21:44:19 PC /usr/lib/gdm3/gdm-x-session[986]: (II) event0  - Power Button: device removed
Nov 17 21:44:19 PC /usr/lib/gdm3/gdm-x-session[986]: (**) Option "fd" "43"
Nov 17 21:44:19 PC /usr/lib/gdm3/gdm-x-session[986]: (II) event5  - Logitech M705: device removed
Nov 17 21:44:19 PC /usr/lib/gdm3/gdm-x-session[986]: (**) Option "fd" "44"
Nov 17 21:44:19 PC /usr/lib/gdm3/gdm-x-session[986]: (II) event2  - Logitech M310: device removed
Nov 17 21:44:19 PC /usr/lib/gdm3/gdm-x-session[986]: (**) Option "fd" "45"
Nov 17 21:44:19 PC /usr/lib/gdm3/gdm-x-session[986]: (**) Option "fd" "46"
Nov 17 21:44:19 PC /usr/lib/gdm3/gdm-x-session[986]: (II) event3  - Logitech M185: device removed
Nov 17 21:44:19 PC /usr/lib/gdm3/gdm-x-session[986]: (**) Option "fd" "47"
Nov 17 21:44:19 PC /usr/lib/gdm3/gdm-x-session[986]: (II) event6  - Eee PC WMI hotkeys: device removed
Nov 17 21:44:19 PC /usr/lib/gdm3/gdm-x-session[986]: (**) Option "fd" "45"
Nov 17 21:44:19 PC /usr/lib/gdm3/gdm-x-session[986]: (II) event4  - Logitech K520: device removed
Nov 17 21:44:22 PC kernel: [   88.710117] nvidia-modeset: WARNING: GPU:0: Lost display notification (0:0x00000000); continuing.
Nov 17 21:44:24 PC kernel: [   90.710945] nvidia-modeset: ERROR: GPU:0: Idling display engine timed out: 0x0000987d:0:0
Nov 17 21:44:26 PC kernel: [   92.710203] nvidia-modeset: ERROR: GPU:0: Idling display engine timed out: 0x0000917e:0:0
Nov 17 21:44:28 PC kernel: [   94.711417] nvidia-modeset: ERROR: GPU:0: Idling display engine timed out: 0x0000987d:0:0
Nov 17 21:44:30 PC kernel: [   96.710834] nvidia-modeset: ERROR: GPU:0: Idling display engine timed out: 0x0000917e:0:0
Nov 17 21:44:33 PC kernel: [   99.745501] nvidia-modeset: WARNING: GPU:0: Lost display notification (0:0x00000000); continuing.
Nov 17 21:44:33 PC /usr/lib/gdm3/gdm-x-session[986]: (II) systemd-logind: got pause for 13:64
Nov 17 21:44:33 PC /usr/lib/gdm3/gdm-x-session[986]: (II) systemd-logind: got pause for 13:65
Nov 17 21:44:33 PC /usr/lib/gdm3/gdm-x-session[986]: (II) systemd-logind: got pause for 13:67
Nov 17 21:44:33 PC /usr/lib/gdm3/gdm-x-session[986]: (II) systemd-logind: got pause for 13:66
Nov 17 21:44:33 PC /usr/lib/gdm3/gdm-x-session[986]: (II) systemd-logind: got pause for 13:70
Nov 17 21:44:33 PC /usr/lib/gdm3/gdm-x-session[986]: (II) systemd-logind: got pause for 13:69
Nov 17 21:44:33 PC /usr/lib/gdm3/gdm-x-session[986]: (II) systemd-logind: got pause for 13:68
Nov 17 21:44:33 PC systemd[1]: Started Getty on tty3.
Nov 17 21:44:33 PC systemd[974]: Starting Sound Service...
Nov 17 21:44:33 PC dbus-daemon[725]: [system] Activating via systemd: service name='org.freedesktop.RealtimeKit1' unit='rtkit-daemon.service' requested by ':1.43' (uid=121 pid=1133 comm="/usr/bin/p
ulseaudio --daemonize=no " label="unconfined")
Nov 17 21:44:33 PC systemd[1]: Starting RealtimeKit Scheduling Policy Service...
Nov 17 21:44:33 PC dbus-daemon[725]: [system] Successfully activated service 'org.freedesktop.RealtimeKit1'
Nov 17 21:44:33 PC systemd[1]: Started RealtimeKit Scheduling Policy Service.
Nov 17 21:44:33 PC rtkit-daemon[1134]: Successfully called chroot.
Nov 17 21:44:33 PC rtkit-daemon[1134]: Successfully dropped privileges.
Nov 17 21:44:33 PC rtkit-daemon[1134]: Successfully limited resources.
Nov 17 21:44:33 PC rtkit-daemon[1134]: Running.
Nov 17 21:44:33 PC rtkit-daemon[1134]: Canary thread running.
Nov 17 21:44:33 PC rtkit-daemon[1134]: Watchdog thread running.
Nov 17 21:44:33 PC dbus-daemon[725]: [system] Activating via systemd: service name='org.bluez' unit='dbus-org.bluez.service' requested by ':1.55' (uid=121 pid=1133 comm="/usr/bin/pulseaudio --daemo
nize=no " label="unconfined")
Nov 17 21:44:34 PC systemd[974]: Started Sound Service.
Nov 17 21:44:34 PC dbus-daemon[725]: [system] Activating via systemd: service name='org.freedesktop.locale1' unit='dbus-org.freedesktop.locale1.service' requested by ':1.42' (uid=121 pid=1120 comm=
"/usr/bin/gnome-shell " label="unconfined")
Nov 17 21:44:34 PC systemd[1]: Starting Locale Service...
Nov 17 21:44:35 PC dbus-daemon[725]: [system] Successfully activated service 'org.freedesktop.locale1'
Nov 17 21:44:35 PC systemd[1]: Started Locale Service.
Nov 17 21:44:35 PC dbus-daemon[1077]: [session uid=121 pid=1077] Activating service name='org.freedesktop.portal.IBus' requested by ':1.18' (uid=121 pid=1152 comm="ibus-daemon --xim --panel disable
 " label="unconfined")
Nov 17 21:44:35 PC dbus-daemon[1077]: [session uid=121 pid=1077] Successfully activated service 'org.freedesktop.portal.IBus'
Nov 17 21:44:35 PC dbus-daemon[725]: [system] Activating via systemd: service name='org.freedesktop.GeoClue2' unit='geoclue.service' requested by ':1.42' (uid=121 pid=1120 comm="/usr/bin/gnome-shel
l " label="unconfined")
Nov 17 21:44:35 PC systemd[1]: Starting Location Lookup Service...
Nov 17 21:44:35 PC dbus-daemon[725]: [system] Activating via systemd: service name='org.freedesktop.bolt' unit='bolt.service' requested by ':1.42' (uid=121 pid=1120 comm="/usr/bin/gnome-shell " lab
el="unconfined")
Nov 17 21:44:35 PC dbus-daemon[725]: [system] Successfully activated service 'org.freedesktop.GeoClue2'
Nov 17 21:44:35 PC systemd[1]: Starting Thunderbolt system service...
Nov 17 21:44:35 PC systemd[1]: Started Location Lookup Service.
Nov 17 21:44:35 PC dbus-daemon[725]: [system] Activating via systemd: service name='org.freedesktop.PackageKit' unit='packagekit.service' requested by ':1.42' (uid=121 pid=1120 comm="/usr/bin/gnome
-shell " label="unconfined")
Nov 17 21:44:35 PC systemd[1]: Starting PackageKit Daemon...
Nov 17 21:44:35 PC spice-vdagent[1181]: Cannot access vdagent virtio channel /dev/virtio-ports/com.redhat.spice.0
Nov 17 21:44:35 PC boltd[1176]: bolt 0.4 starting up.
Nov 17 21:44:35 PC boltd[1176]: config: loading user config
Nov 17 21:44:35 PC boltd[1176]: store: loading devices
Nov 17 21:44:35 PC gnome-session[1083]: gnome-session-binary[1083]: WARNING: App 'spice-vdagent.desktop' exited with code 1
Nov 17 21:44:35 PC gnome-session-binary[1083]: WARNING: App 'spice-vdagent.desktop' exited with code 1
Nov 17 21:44:35 PC boltd[1176]: power: force_power support: no
Nov 17 21:44:35 PC boltd[1176]: udev: enumerating devices
Nov 17 21:44:35 PC dbus-daemon[725]: [system] Successfully activated service 'org.freedesktop.bolt'
Nov 17 21:44:35 PC systemd[1]: Started Thunderbolt system service.
Nov 17 21:44:35 PC dbus-daemon[725]: [system] Activating via systemd: service name='org.freedesktop.hostname1' unit='dbus-org.freedesktop.hostname1.service' requested by ':1.60' (uid=121 pid=1193 c
omm="/usr/lib/gnome-settings-daemon/gsd-media-keys " label="unconfined")
Nov 17 21:44:35 PC systemd[1]: Starting Hostname Service...
Nov 17 21:44:35 PC PackageKit: daemon start
Nov 17 21:44:36 PC dbus-daemon[725]: [system] Activating via systemd: service name='org.freedesktop.ColorManager' unit='colord.service' requested by ':1.64' (uid=121 pid=1185 comm="/usr/lib/gnome-settings-daemon/gsd-color " label="unconfined")
Nov 17 21:44:36 PC gnome-session-binary[1083]: Entering running state
Nov 17 21:44:36 PC systemd[1]: Starting Manage, Install and Generate Color Profiles...
Nov 17 21:44:36 PC dbus-daemon[725]: [system] Successfully activated service 'org.freedesktop.hostname1'
Nov 17 21:44:36 PC systemd[1]: Started Hostname Service.
Nov 17 21:44:36 PC xbrlapi.desktop[1259]: openConnection: connect: No such file or directory
Nov 17 21:44:36 PC xbrlapi.desktop[1259]: cannot connect to braille devices daemon brltty at :0
Nov 17 21:44:36 PC dbus-daemon[725]: [system] Successfully activated service 'org.freedesktop.ColorManager'
Nov 17 21:44:36 PC systemd[1]: Started Manage, Install and Generate Color Profiles.
Nov 17 21:44:36 PC gnome-shell[1120]: Error looking up permission: GDBus.Error:org.freedesktop.DBus.Error.ServiceUnknown: The name org.freedesktop.impl.portal.PermissionStore was not provided by any .service files
Nov 17 21:44:36 PC dbus-daemon[725]: [system] Successfully activated service 'org.freedesktop.PackageKit'
Nov 17 21:44:36 PC systemd[1]: Started PackageKit Daemon.
Nov 17 21:44:36 PC gnome-shell[1120]: JS WARNING: [resource:///org/gnome/shell/ui/layout.js 29]: reference to undefined property "MetaWindowX11"
Nov 17 21:44:36 PC gnome-shell[1120]: clutter-offscreen-effect.c:205: Unable to create an Offscreen buffer
Nov 17 21:44:37 PC gsd-color[1185]: failed to obtain org.freedesktop.color-manager.create-profile auth
Nov 17 21:44:37 PC gsd-color[1185]: failed to create device: failed to obtain org.freedesktop.color-manager.create-device auth
Nov 17 21:44:37 PC gnome-shell[1120]: clutter-offscreen-effect.c:205: Unable to create an Offscreen buffer
Nov 17 21:44:46 PC kernel: [  112.262664] NVRM: GPU at PCI:0000:01:00: GPU-29cefe64-549a-0429-9f52-67763574938b
Nov 17 21:44:46 PC kernel: [  112.262699] NVRM: GPU Board Serial Number: 
Nov 17 21:44:46 PC kernel: [  112.262710] NVRM: Xid (PCI:0000:01:00): 16, Head 00000000 Count 0000000a
Nov 17 21:44:50 PC kernel: [  116.358337] NVRM: Xid (PCI:0000:01:00): 8, Channel 00000008
Nov 17 21:44:54 PC kernel: [  120.453774] NVRM: Xid (PCI:0000:01:00): 16, Head 00000000 Count 0000000b
Nov 17 21:44:38 PC gnome-shell[1120]: message repeated 54 times: [ clutter-offscreen-effect.c:205: Unable to create an Offscreen buffer]
Nov 17 21:45:00 PC gnome-shell[1120]: clutter-offscreen-effect.c:205: Unable to create an Offscreen buffer
Ještě jsem se pokusil vyčíst parametry modulů ze /sys/module/$module/parameters/. Tady mě trochu zaráží, že moduly nvidia a nvidia_modeset nemají žádné. Takže si neumím ověřit aktuální hodnoty vstupů dle modinfo...
Module: nvidia_drm
Parameter: modeset --> N
Module: nvidia_uvm
Parameter: uvm8_ats_mode --> -1
Parameter: uvm_channel_gpfifo_loc --> auto
Parameter: uvm_channel_gpput_loc --> auto
Parameter: uvm_channel_num_gpfifo_entries --> 1024
Parameter: uvm_channel_pushbuffer_loc --> auto
Parameter: uvm_debug_enable_push_desc --> 0
Parameter: uvm_debug_prints --> 0
Parameter: uvm_driver_mode --> 8
Parameter: uvm_enable_builtin_tests --> 0
Parameter: uvm_enable_debug_procfs --> 0
Parameter: uvm_fault_force_sysmem --> 0
Parameter: uvm_force_prefetch_fault_support --> 0
Parameter: uvm_global_oversubscription --> 1
Parameter: uvm_hmm --> 0
Parameter: uvm_leak_checker --> 0
Parameter: uvm_page_table_location --> (null)
Parameter: uvm_perf_access_counter_batch_count --> 256
Parameter: uvm_perf_access_counter_granularity --> 2m
Parameter: uvm_perf_access_counter_mimc_migration_enable --> -1
Parameter: uvm_perf_access_counter_momc_migration_enable --> -1
Parameter: uvm_perf_access_counter_threshold --> 256
Parameter: uvm_perf_fault_batch_count --> 256
Parameter: uvm_perf_fault_coalesce --> 1
Parameter: uvm_perf_fault_max_batches_per_service --> 20
Parameter: uvm_perf_fault_max_throttle_per_service --> 5
Parameter: uvm_perf_fault_replay_policy --> 2
Parameter: uvm_perf_fault_replay_update_put_ratio --> 50
Parameter: uvm_perf_map_remote_on_eviction --> 1
Parameter: uvm_perf_map_remote_on_native_atomics_fault --> 0
Parameter: uvm_perf_migrate_cpu_preunmap_block_order --> 2
Parameter: uvm_perf_migrate_cpu_preunmap_enable --> 1
Parameter: uvm_perf_prefetch_enable --> 1
Parameter: uvm_perf_prefetch_min_faults --> 1
Parameter: uvm_perf_prefetch_threshold --> 51
Parameter: uvm_perf_reenable_prefetch_faults_lapse_msec --> 1000
Parameter: uvm_perf_thrashing_enable --> 1
Parameter: uvm_perf_thrashing_epoch_msec --> 1000
Parameter: uvm_perf_thrashing_lapse_usec --> 250
Parameter: uvm_perf_thrashing_max_resets --> 4
Parameter: uvm_perf_thrashing_nap_usec --> 500
Parameter: uvm_perf_thrashing_pin_msec --> 150
Parameter: uvm_perf_thrashing_pin_threshold --> 10
Parameter: uvm_perf_thrashing_threshold --> 3
18.11.2018 01:44 pc2005 | skóre: 38 | blog: GardenOfEdenConfiguration | liberec
Rozbalit Rozbalit vše Re: Změna IRQ pro komponentu
Nov 17 21:40:45 PC /usr/lib/gdm3/gdm-x-session[1427]: (EE) NVIDIA(0): The NVIDIA X driver has encountered an error; attempting to
Nov 17 21:40:45 PC /usr/lib/gdm3/gdm-x-session[1427]: (EE) NVIDIA(0):     recover...
Jakej je výpis /var/log/Xorg* ? To vypadá na nějakej problém s driverama.

Jinak
PCI-MSI 524288-edge      nvidia
takže to teďka jede na MSI.
21.11.2018 19:50 Ariczek | skóre: 5
Rozbalit Rozbalit vše Re: Změna IRQ pro komponentu
Aktuální freeze:
Nov 21 19:33:48 PC /usr/lib/gdm3/gdm-x-session[1380]: (EE) NVIDIA(0): The NVIDIA X driver has encountered an error; attempting to
Nov 21 19:33:48 PC /usr/lib/gdm3/gdm-x-session[1380]: (EE) NVIDIA(0):     recover...
Nov 21 19:33:52 PC kernel: [  692.224052] NVRM: Xid (PCI:0000:01:00): 8, Channel 00000018
Nov 21 19:33:52 PC kernel: [  694.223908] NVRM: os_schedule: Attempted to yield the CPU while in atomic or interrupt context
Nov 21 19:33:52 PC kernel: [  696.223835] NVRM: os_schedule: Attempted to yield the CPU while in atomic or interrupt context
Nov 21 19:33:52 PC /usr/lib/gdm3/gdm-x-session[1380]: (II) event5  - Logitech M705: SYN_DROPPED event - some input events have been lost.
Nov 21 19:33:58 PC kernel: [  702.399786] NVRM: Xid (PCI:0000:01:00): 16, Head 00000000 Count 00010cf6
Nov 21 19:34:04 PC kernel: [  704.447886] NVRM: Xid (PCI:0000:01:00): 8, Channel 0000001a
Nov 21 19:34:04 PC kernel: [  706.447743] NVRM: os_schedule: Attempted to yield the CPU while in atomic or interrupt context
Nov 21 19:34:04 PC kernel: [  708.447799] NVRM: os_schedule: Attempted to yield the CPU while in atomic or interrupt context
Nov 21 19:34:16 PC kernel: [  716.735776] NVRM: Xid (PCI:0000:01:00): 8, Channel 0000001a
Nov 21 19:34:16 PC kernel: [  718.735646] NVRM: os_schedule: Attempted to yield the CPU while in atomic or interrupt context
Nov 21 19:34:16 PC kernel: [  720.735612] NVRM: os_schedule: Attempted to yield the CPU while in atomic or interrupt context
Nov 21 19:34:28 PC kernel: [  729.023679] NVRM: Xid (PCI:0000:01:00): 8, Channel 0000001a
Nov 21 19:34:28 PC kernel: [  731.023494] NVRM: os_schedule: Attempted to yield the CPU while in atomic or interrupt context
Nov 21 19:34:28 PC kernel: [  733.023468] NVRM: os_schedule: Attempted to yield the CPU while in atomic or interrupt context
Nov 21 19:34:37 PC kernel: [  741.311635] NVRM: Xid (PCI:0000:01:00): 8, Channel 0000001a
Nov 21 19:34:39 PC kernel: [  743.311379] NVRM: os_schedule: Attempted to yield the CPU while in atomic or interrupt context
Nov 21 19:34:41 PC kernel: [  745.311357] NVRM: os_schedule: Attempted to yield the CPU while in atomic or interrupt context
Nov 21 19:34:49 PC kernel: [  753.599428] NVRM: Xid (PCI:0000:01:00): 8, Channel 0000001a
Nov 21 19:34:51 PC kernel: [  755.599128] NVRM: os_schedule: Attempted to yield the CPU while in atomic or interrupt context
Nov 21 19:34:53 PC kernel: [  757.599112] NVRM: os_schedule: Attempted to yield the CPU while in atomic or interrupt context
Nov 21 19:35:05 PC kernel: [  765.887218] NVRM: Xid (PCI:0000:01:00): 8, Channel 0000001a
Nov 21 19:35:05 PC kernel: [  767.886972] NVRM: os_schedule: Attempted to yield the CPU while in atomic or interrupt context
Nov 21 19:35:05 PC kernel: [  769.886878] NVRM: os_schedule: Attempted to yield the CPU while in atomic or interrupt context
Nov 21 19:35:14 PC kernel: [  778.174900] NVRM: Xid (PCI:0000:01:00): 8, Channel 0000001a
Nov 21 19:35:16 PC kernel: [  780.174692] NVRM: os_schedule: Attempted to yield the CPU while in atomic or interrupt context
Nov 21 19:35:18 PC kernel: [  782.174656] NVRM: os_schedule: Attempted to yield the CPU while in atomic or interrupt context
Nov 21 19:35:26 PC /usr/lib/gdm3/gdm-x-session[1380]: (EE) NVIDIA(0): Error recovery failed.
Nov 21 19:35:26 PC /usr/lib/gdm3/gdm-x-session[1380]: (EE) NVIDIA(0):  *** Aborting ***
Nov 21 19:35:26 PC /usr/lib/gdm3/gdm-x-session[1380]: (EE)
Nov 21 19:35:26 PC /usr/lib/gdm3/gdm-x-session[1380]: Fatal server error:
Nov 21 19:35:26 PC /usr/lib/gdm3/gdm-x-session[1380]: (EE) Failed to recover from error!
Nov 21 19:35:26 PC /usr/lib/gdm3/gdm-x-session[1380]: (EE)
Nov 21 19:35:26 PC /usr/lib/gdm3/gdm-x-session[1380]: (EE)
Nov 21 19:35:26 PC /usr/lib/gdm3/gdm-x-session[1380]: Please consult the The X.Org Foundation support
Nov 21 19:35:26 PC /usr/lib/gdm3/gdm-x-session[1380]: #011 at http://wiki.x.org
Nov 21 19:35:26 PC /usr/lib/gdm3/gdm-x-session[1380]:  for help.
Nov 21 19:35:26 PC /usr/lib/gdm3/gdm-x-session[1380]: (EE) Please also check the log file at "/var/log/Xorg.1.log" for additional information.
Nov 21 19:35:26 PC /usr/lib/gdm3/gdm-x-session[1380]: (EE)
Nov 21 19:35:29 PC /usr/lib/gdm3/gdm-x-session[1380]: (EE) NVIDIA(GPU-0): WAIT (2, 8, 0x8000, 0x0000141c, 0x000014e4)
Nov 21 19:35:30 PC kernel: [  790.462696] NVRM: Xid (PCI:0000:01:00): 8, Channel 0000001a
Nov 21 19:35:30 PC kernel: [  792.462450] NVRM: os_schedule: Attempted to yield the CPU while in atomic or interrupt context
Nov 21 19:35:30 PC kernel: [  794.462387] NVRM: os_schedule: Attempted to yield the CPU while in atomic or interrupt context
Nov 21 19:35:36 PC /usr/lib/gdm3/gdm-x-session[1380]: (EE) NVIDIA(GPU-0): WAIT (1, 8, 0x8000, 0x0000141c, 0x000014e4)
Nov 21 19:35:39 PC kernel: [  803.480330] nvidia-modeset: WARNING: GPU:0: Lost display notification (0:0x00000000); continuing.
Nov 21 19:35:41 PC kernel: [  805.490035] nvidia-modeset: ERROR: GPU:0: Idling display engine timed out: 0x0000987d:0:0
Nov 21 19:35:43 PC kernel: [  807.490002] nvidia-modeset: ERROR: GPU:0: Idling display engine timed out: 0x0000917e:0:0
Nov 21 19:35:45 PC kernel: [  809.493258] nvidia-modeset: ERROR: GPU:0: Idling display engine timed out: 0x0000987d:0:0
Nov 21 19:35:47 PC kernel: [  811.493263] nvidia-modeset: ERROR: GPU:0: Idling display engine timed out: 0x0000917e:0:0
Nov 21 19:35:50 PC /usr/lib/gdm3/gdm-x-session[1380]: (WW) NVIDIA(0): WAIT (2-S, 17, 0x019a, 0x0000141c, 0x00001588)
Jediná část podobná tomu nahoře s EE je v souboru /var/log/Xorg.1.log:
[   692.508] (EE) NVIDIA(0): The NVIDIA X driver has encountered an error; attempting to
[   692.508] (EE) NVIDIA(0):     recover...
[   696.509] (II) event5  - Logitech M705: SYN_DROPPED event - some input events have been lost.
[   790.748] (EE) NVIDIA(0): Error recovery failed.
[   790.748] (EE) NVIDIA(0):  *** Aborting ***
[   790.748] (EE) 
Fatal server error:
[   790.748] (EE) Failed to recover from error!
[   790.748] (EE) 
[   790.748] (EE) 
Please consult the The X.Org Foundation support 
         at http://wiki.x.org
 for help. 
[   790.748] (EE) Please also check the log file at "/var/log/Xorg.1.log" for additional information.
[   790.748] (EE) 
[   793.748] (EE) NVIDIA(GPU-0): WAIT (2, 8, 0x8000, 0x0000141c, 0x000014e4)
[   800.748] (EE) NVIDIA(GPU-0): WAIT (1, 8, 0x8000, 0x0000141c, 0x000014e4)
[   814.781] (WW) NVIDIA(0): WAIT (2-S, 17, 0x019a, 0x0000141c, 0x00001588)
21.11.2018 23:12 pc2005 | skóre: 38 | blog: GardenOfEdenConfiguration | liberec
Rozbalit Rozbalit vše Re: Změna IRQ pro komponentu
The NVIDIA X driver has encountered an error; attempting to
Problém je, že chyba nastala před touhle hláškou a všechny výpisy, co jsi poslal jsou, až v době kdy se systém snaží tu chybu opravit. Ideální by bylo posílat kompletní logy, ne jen kousky.

Nemáš doufám v systému nainstalovaný nouveau (opensource) driver (nebo jeho zbytky), že ne?

Jinak mě už nic jinýho s těmito informacemi nenapadá. Jedině poškozený HW.

22.11.2018 08:37 dustin | skóre: 62 | blog: dustin
Rozbalit Rozbalit vše Re: Změna IRQ pro komponentu
Nestudoval jsem detaily, ale poškozený HW bych také nevyloučil.

Mám také záhadné problémy s GTX1060. Její PCI-ID chybělo v nejnovějším linuxovém driveru od nvidie, musel jsem downgradovat. OK, to bych bral jako chybu nvidie, i když nechápu...

Ve windows ji nejnovější nvidií driver vůbec nepozná, windows zahlásí, že je s ní nějaký problém, klasická chyba 43 (např. https://appuals.com/fix-nvidia-code-43-windows-stopped-device-reported-problems/). Starší verze win driveru OK (jenže v té zase synovi padají některé hry, klasika...).

Takže se dovedu představit, že se třeba zašvihne driver při komunikaci s kartou a vezme s sebou celé jádro...
22.11.2018 10:24 Ariczek | skóre: 5
Rozbalit Rozbalit vše Re: Změna IRQ pro komponentu
Jak píšu v originálním dotazu,
řeším problém se zamrzáním PC, který nevím, zda je SW nebo HW.
Co jsem asi zapomněl napsat, kartu jsem po té, co s ní mají nezávisle problémy 2 různé PC, poslal na reklamaci. Vyjádření autorizovaného servisu za czc.cz bylo, že Neuznáno. Uvedená závada se během testování neprojevily. Vráceno zpět bez opravy.

Tak jsem se pak začal hloubat v SW.
22.11.2018 10:33 dustin | skóre: 62 | blog: dustin
Rozbalit Rozbalit vše Re: Změna IRQ pro komponentu
Klasika, to je přesně důvod, proč většinou kupuju jeté věci. Záruka bývá obvykle k ničemu...
25.11.2018 18:55 Ariczek | skóre: 5
Rozbalit Rozbalit vše Re: Změna IRQ pro komponentu
Příloha:
Ok, dávám do přílohy celý syslog, chyba nastala dnes v 17:44.

Ad nouveau: Snažil jsem se případné pohrobky zabít:
/etc/modprobe.d$ cat blacklist-nvidia-nouveau.conf
blacklist nouveau
options nouveau modeset=0
25.11.2018 22:34 pc2005 | skóre: 38 | blog: GardenOfEdenConfiguration | liberec
Rozbalit Rozbalit vše Re: Změna IRQ pro komponentu
(II) LoadModule: "nouveau"
Ještě že jsem ze zeptal :-P.

Od nouveau budou tři části kernel modul a xorg driver pro komunikaci s kernelem a mesa GL. Nvidia proprietární potřebuje aby v systému nebyl ani jeden, doinstaluje si vlastní. Asi by šlo nějak nastavit aby se ignoroval xorg driver a kernel modul by mělo stačit blacklistovat, ale ta mesa bude vždycky komplikovaná. Snad jsem slyšel o nějakým wrapperu okolo mesy a priprietární implementace opengl, ubuntoidy neznám podrobně, ale na slackwaru mě instalace proprietárního driveru vždycky rozbila knihovny, takže jsem je musel mazat a opravovat manuálně.

Nouveau prostě dostat ze systému kompletně. Jak je vidět, z Xorg.conf:
Nov 25 17:42:33 PC /usr/lib/gdm3/gdm-x-session[1132]: (II) LoadModule: "nvidia"
...
Nov 25 17:42:33 PC /usr/lib/gdm3/gdm-x-session[1132]: (II) LoadModule: "nouveau"
Tak to najednou načte oba drivery a bůhví co to udělá se systémem.

options nouveau modeset=0
Tohle je naprosto zbytečný, pokud je blacklistovanej. Ale lepší kdyby nebyl v systému vůbec.
AIGLX: reverting to software rendering
Tahle hláška vznikla kdy? Hláška znamená, že ti nejede vůbec 3D akcelerace. Ale je zajímavý, že není při každém spuštění xek.
== Stack trace for context 0x55e47389c320 ==
Ten system je dobře rozkopanej o_O. Nebo to byl polomrtvý systém po driverů na grafiku?

25.11.2018 22:50 pc2005 | skóre: 38 | blog: GardenOfEdenConfiguration | liberec
Rozbalit Rozbalit vše Re: Změna IRQ pro komponentu
Jo aha tys mezitím to nouveau vyhodil?

Ještě můžeš ověřit zda, když odinstaluješ proprietární driver, tak zda /usr/lib/x86_64-linux-gnu/nvidia/xorg/libglx.so a vlastně celej adresář zmizí (použij ssh, protože nebudeš mít video :-D). A zda po odinstalování stále existuje v systému nějaká knihovna s *glx* v názvu.
Matched nouveau as autoconfigured driver
Pořád tam máš

Koukám ještě se tam snaží načíst vesa a fb, ale to by snad nemělo vadit, ty jsou dost high level, že by neměly proprietární driver s neznámým kódem rozhodit (i když teda poslední proprietární driver pro geforce2MX taky neuměl framebuffer - ale to už je skoro 7 let co jsem ho používal).
26.11.2018 08:45 Ariczek | skóre: 5
Rozbalit Rozbalit vše Re: Změna IRQ pro komponentu
No, většinou to vypadá tak, že hodím něco ve smyslu:
apt install nvidia-driver-415
Když to doběhne, tak udělám reboot. Pak testuju se zamrzáním.

A pak se zase dostanu do konzole, udělám
apt remove nvidia-driver-415
a
apt autoremove
a opět reboot.

A tím se dostanu do stavu, kdy je systém použitelný dlouhodobě, ale 3D grafika nefunguje...

To byl ten důvod, proč jsem osekával syslogy, protože po většinu času OS nějak funguje (nezamrzá) ale čert ví co mám v tu chvíli běžícího.
26.11.2018 22:59 pc2005 | skóre: 38 | blog: GardenOfEdenConfiguration | liberec
Rozbalit Rozbalit vše Re: Změna IRQ pro komponentu
apt remove nvidia-driver-415
Nenainstaluje se při tom nouveau jako náhrada?

BTW odkud máš driver 415? Podle obou syslog výpisů máš ubuntu 18.04 (bionic?) a tam je nejnovější 390. Dokonce i v ubuntu disco je nejnovější verze pouze 410.

Jestli jsi zkoušel různé verze a do toho ještě balíky přímo od nvidie, tak sis mohl dost zaneřádit systém. Třeba jenom tím, že někdo v těch verzích zapomněl updatovat nějakej konfigurák apod. Můžeš zkusit
apt purge
na ty daný balíky. Osobně bych ale zkusil čistou reinstalaci (třeba na to nejnovější ubuntu "disco"). Balíky přímo od nvidie jenom jako poslední možnost s tím, že nemusí být kompatibilní se zbytkem systému (je důvod proč má ubuntu přímo vlastní balíček).
To byl ten důvod, proč jsem osekával syslogy, protože po většinu času OS nějak funguje (nezamrzá) ale čert ví co mám v tu chvíli běžícího.
Připravuješ nás tím ale o důležité informace jako je verze OS, verze driverů, hlášení Xorg.log apod. Ono třeba i tohle (z logu odtud):
Nov 25 19:01:30 PC systemd[1]: Stopped NVIDIA Persistence Daemon.
Nov 25 19:01:30 PC systemd[1]: Starting NVIDIA Persistence Daemon...
Nov 25 19:01:30 PC systemd[1]: Started NVIDIA Persistence Daemon.
Nov 25 19:01:30 PC systemd[1]: Stopping NVIDIA Persistence Daemon...
Nov 25 19:01:30 PC systemd[1]: Stopped NVIDIA Persistence Daemon.
Nov 25 19:01:30 PC systemd[1]: Starting NVIDIA Persistence Daemon...
Není něco co vypadá normálně (několikrát za sekundu se zapne a vypne).

Pokud se vydáš cestou ruční kontroly, tak odinstaluj všechno co souvisí s nvidia grafikou a ručně si ověř zda v systému opravdu nezbyly žádné soubory. Pro nvidia 390 v bionicu například seznam zde, ale pozor rozhodně to není komplet seznam (a můžeš mít jiné verze), musel bys proklikat všechny závislé balíky odsud. Dále v systému nesmí být soubor s "nouveau" v názvu a v /etc nesmí být zmínka o nouveau (kromě konfiguráku pro blacklist) dale bych hledal knihovny, které mají v sobě string libgl/libGL, libegl/libEGL apod (pozor může to být i jen shoda jmen, vždycky se koukni ke kterému balíčku to patří).
25.11.2018 00:28 gogol
Rozbalit Rozbalit vše Re: Změna IRQ pro komponentu
V súčasnosti to síce nieje už moc aktuálne, ale v dobách keď sme bojovali s malým počtom IRQ liniek sa písali ovládače tak, že hw zvládal beať na aj zdielanom IRQ. Všetko sa zmenilo príchodom I/O APIC a multiprocessingu. Problém s IRQ bude v súčasnosti dosť ojedinelý a ja osobne som naňho narazil akurát u archaického hardware a u ovládača, ktorý je ktomu hw písaný pred 10 rokmi, ale ani u neho jadro nespadne, len zahlási problém s IRQ. Jadro je možné ovšem zostreliť veľmi jednoducho ak je v ovládači matematická chyba delenia nulou a trocha ťažšie a nepredvítateľne ak je pri multi processingu chybne ošetrená synchronizácia kontextu. Inak povedané ak je chyba v ovládači, tak si s týmto ovládačom asi nepomôžeš.
25.11.2018 09:15 Peter Golis | skóre: 58 | Bratislava
Rozbalit Rozbalit vše Re: Změna IRQ pro komponentu
Chcel by som si pozrieť ako by si dokázal zdieľať v tých časoch jedno prerušenie pre napríklad 3d grafickú kartu a hw raid radič.
25.11.2018 01:43 theseuszn
Rozbalit Rozbalit vše Re: Změna IRQ pro komponentu
Zkus ty drivery odebrat, očistit os a nasadit v.390.87. Já sice "Ti" nemám, mám jen obyč 1050-tku, ale ostatní drivery mi taky blbly, sice ne až tak, jak popisuješ, ale blbly. Ve verzi 390.87 mám klid
25.11.2018 20:31 Ariczek | skóre: 5
Rozbalit Rozbalit vše Re: Změna IRQ pro komponentu
Příloha:
Obávám, že ani verze 390 nefunguje tak jak má na mém pc.

Přikládám logy, k zamrznutí došlo někdy 19:19.

Založit nové vláknoNahoru

Tiskni Sdílej: Linkuj Jaggni to Vybrali.sme.sk Google Del.icio.us Facebook

ISSN 1214-1267   www.czech-server.cz
© 1999-2015 Nitemedia s. r. o. Všechna práva vyhrazena.