abclinuxu.cz AbcLinuxu.cz itbiz.cz ITBiz.cz HDmag.cz HDmag.cz abcprace.cz AbcPráce.cz
Inzerujte na AbcPráce.cz od 950 Kč
Rozšířené hledání
×
    dnes 22:44 | IT novinky

    IBM kupuje společnost HashiCorp za 6,4 miliardy dolarů, tj. 35 dolarů za akcii.

    Ladislav Hagara | Komentářů: 0
    dnes 15:55 | Nová verze

    Byl vydán TrueNAS SCALE 24.04 “Dragonfish”. Přehled novinek této open source storage platformy postavené na Debianu v poznámkách k vydání.

    Ladislav Hagara | Komentářů: 0
    dnes 13:44 | IT novinky

    Oznámeny byly nové Raspberry Pi Compute Module 4S. Vedle původní 1 GB varianty jsou nově k dispozici také varianty s 2 GB, 4 GB a 8 GB paměti. Compute Modules 4S mají na rozdíl od Compute Module 4 tvar a velikost Compute Module 3+ a předchozích. Lze tak provést snadný upgrade.

    Ladislav Hagara | Komentářů: 0
    dnes 04:44 | Nová verze

    Po roce vývoje od vydání verze 1.24.0 byla vydána nová stabilní verze 1.26.0 webového serveru a reverzní proxy nginx (Wikipedie). Nová verze přináší řadu novinek. Podrobný přehled v souboru CHANGES-1.26.

    Ladislav Hagara | Komentářů: 0
    dnes 04:33 | Nová verze

    Byla vydána nová verze 6.2 živé linuxové distribuce Tails (The Amnesic Incognito Live System), jež klade důraz na ochranu soukromí uživatelů a anonymitu. Přehled změn v příslušném seznamu. Tor Browser byl povýšen na verzi 13.0.14.

    Ladislav Hagara | Komentářů: 0
    dnes 04:22 | Nová verze

    Byla vydána nová verze 30.0.0 frameworku pro vývoj multiplatformních desktopových aplikací pomocí JavaScriptu, HTML a CSS Electron (Wikipedie, GitHub). Chromium bylo aktualizováno na verzi 124.0.6367.49, V8 na verzi 12.4 a Node.js na verzi 20.11.1. Electron byl původně vyvíjen pro editor Atom pod názvem Atom Shell. Dnes je na Electronu postavena celá řada dalších aplikací.

    Ladislav Hagara | Komentářů: 1
    dnes 04:11 | Nová verze

    Byla vydána nová verze 9.0.0 otevřeného emulátoru procesorů a virtualizačního nástroje QEMU (Wikipedie). Přispělo 220 vývojářů. Provedeno bylo více než 2 700 commitů. Přehled úprav a nových vlastností v seznamu změn.

    Ladislav Hagara | Komentářů: 0
    včera 23:22 | IT novinky

    Evropský parlament dnes přijal směrnici týkající se tzv. práva spotřebitele na opravu. Poslanci ji podpořili 584 hlasy (3 bylo proti a 14 se zdrželo hlasování). Směrnice ujasňuje povinnosti výrobců opravovat zboží a motivovat spotřebitele k tomu, aby si výrobky nechávali opravit a prodloužili tak jejich životnost.

    Ladislav Hagara | Komentářů: 6
    včera 16:11 | Nová verze

    Bylo oznámeno (cs) vydání Fedora Linuxu 40. Přehled novinek ve Fedora Workstation 40 a Fedora KDE 40 na stránkách Fedora Magazinu. Současně byl oznámen notebook Slimbook Fedora 2.

    Ladislav Hagara | Komentářů: 21
    včera 13:44 | Upozornění

    ČTK (Česká tisková kancelář) upozorňuje (X), že na jejím zpravodajském webu České noviny byly dnes dopoledne neznámým útočníkem umístěny dva smyšlené texty, které nepocházejí z její produkce. Jde o text s titulkem „BIS zabránila pokusu o atentát na nově zvoleného slovenského prezidenta Petra Pelligriniho“ a o údajné mimořádné prohlášení ministra Lipavského k témuž. Tyto dezinformace byly útočníky zveřejněny i s příslušnými notifikacemi v mobilní aplikaci Českých novin. ČTK ve svém zpravodajském servisu žádnou informaci v tomto znění nevydala.

    Ladislav Hagara | Komentářů: 29
    KDE Plasma 6
     (72%)
     (9%)
     (2%)
     (17%)
    Celkem 720 hlasů
     Komentářů: 4, poslední 6.4. 15:51
    Rozcestník

    Dotaz: Změna IRQ pro komponentu

    16.11.2018 19:50 Ariczek | skóre: 5
    Změna IRQ pro komponentu
    Přečteno: 770×
    Zdravím,

    řeším problém se zamrzáním PC, který nevím, zda je SW nebo HW.

    OS je Ubuntu, trouble maker si myslím že je ovladač nvidia a 1050Ti karta. Pokud nemám nainstalovány žádné nvidia-driver-* (zkoušel jsem verze 396, 410 i 415), PC funguje OK. Ve chvíli kdy driver nainstaluju, počítač se stane v podstatě nepoužitelný, po nějaké relativně krátké době zcela zamrzne. Dokážu se ze stavu vyhrabat jen přes tvrdý reboot.

    Záznam v syslogu říká:
    irq 16: nobody cared (try booting with the "irqpoll" option)
    
    Po troše googlení jsem narazil na stránku. Bohužel tato úprava nepomohla, stále dochází k zamrzání.

    Po dalším zkoumání (bez nvidia ovladačů) jsem narazil na to, že irq 16 je použita u jiného zařízení:
    user@PC:~$ sudo lshw | grep irq:16 -B11
            *-multimedia
                 description: Audio device
                 product: SBx00 Azalia (Intel HDA)
                 vendor: Advanced Micro Devices, Inc. [AMD/ATI]
                 physical id: 14.2
                 bus info: pci@0000:00:14.2
                 version: 40
                 width: 64 bits
                 clock: 33MHz
                 capabilities: pm bus_master cap_list
                 configuration: driver=snd_hda_intel latency=32
                 resources: irq:16 memory:fe600000-fe603fff
    
    Mám nějakou šanci, jak změnit irq u komponenty či jinak předejít té kolizi?

    S pozdravem, Ariczek

    Odpovědi

    Josef Kufner avatar 16.11.2018 20:16 Josef Kufner | skóre: 70
    Rozbalit Rozbalit vše Re: Změna IRQ pro komponentu
    Možností hýbat s IRQ je pár a hodně záleží, co máš za hardware.

    Mohlo by to jít nastavit v BIOSu. Možná. Některé, hlavně starší počítače, to tam měly. Integrovaná zařízení jde obvykle zakázat, tak bys alespoň mohl zkusit, zda to je konfliktem mezi nimi, nebo něčím jiným.

    V dávných dobách byly po deskách různě rozmístěné jumpery, kterými se to dalo nastavovat. To už asi nebude moc aktuální.

    Další možností by mohlo být přendání jedné z těch karet do sousedního slotu. Pokud je IRQ přiděleno drátem od slotu směrem k procesoru, tak by to v případě konfliktu asi pomohlo. Blbé je, že s Intel HDA se nějak šoupe blbě a na grafiku bývá jen jeden slot.

    Existuje démon irqbalance, který asi nějak řekne chipsetu, jaké přerušení kam routovat. Nezkoumal jsem, jak to funguje, možná by si s tímto poradil.

    Čím novější hardware, tím více autodetekce tam je. Když resetuješ konfiguraci, tak by se mohlo vše nadetekovat znovu a možná lépe. Na to by také mohlo pomoct nabootovat bez nějakých ostatních postradatelných komponent, zda se to při té autokonfiguraci neposbírá nějak lépe.

    Ale asi bych začal aktualizací jádra a firmwaru. Těch pár balíčků můžeš zkusit prihodit z backportů či vývojové větve, neboť na jádře nic přímo nezávisí a zpětná kompatibilita se udržuje.
    Hello world ! Segmentation fault (core dumped)
    17.11.2018 09:04 Ariczek | skóre: 5
    Rozbalit Rozbalit vše Re: Změna IRQ pro komponentu
    Ohledně mého HW - je to přes 6 let starý PC, ve kterém odešla grafika. Jako náhradu jsem koupil právě tu 1050Ti.

    Primární OS tu byl proprietární W10, ale ten nedokážu do použitelného (ne házejícího BSOD) stavu uvést vůbec. Ubuntu bez grafických ovladačů jede celkem OK.

    Ideálně bych potřeboval najít řešení někde na úrovni BIOSu. Hádám že tohle bude i troublemaker na W.

    Ohledně firmware, dmidecode říká:
    BIOS Information
            Vendor: American Megatrends Inc.
            Version: 1604
            Release Date: 10/16/2012
    
    Mám tu stažen novější M5A99X-EVO-ASUS-1708.zip, ale zatím jsem nepřišel na to jak ten .ROM uvnitř nainstalovat.

    Verze kernelu není úplně stará:
    root@PC:~# uname -r
    4.15.0-39-generic
    Celkově HW vypadá následovně:
    root@PC:~# lshw -short
    H/W path       Device     Class       Description
    =================================================
                              system      To be filled by O.E.M. (To be filled by O.E.M.)
    /0                        bus         M5A99X EVO
    /0/0                      memory      64KiB BIOS
    /0/4                      processor   AMD FX(tm)-8120 Eight-Core Processor
    /0/4/5                    memory      384KiB L1 cache
    /0/4/6                    memory      8MiB L2 cache
    /0/4/7                    memory      8MiB L3 cache
    /0/26                     memory      16GiB System Memory
    /0/26/0                   memory      4GiB DIMM DDR3 Synchronous 1333 MHz (0.8 ns)
    /0/26/1                   memory      4GiB DIMM DDR3 Synchronous 1333 MHz (0.8 ns)
    /0/26/2                   memory      4GiB DIMM DDR3 Synchronous 1333 MHz (0.8 ns)
    /0/26/3                   memory      4GiB DIMM DDR3 Synchronous 1333 MHz (0.8 ns)
    /0/100                    bridge      RD9x0/RX980 Host Bridge
    /0/100/2                  bridge      RD890/RD9x0/RX980 PCI to PCI bridge (PCI Express GFX port 0)
    /0/100/2/0                display     GP107 [GeForce GTX 1050 Ti]
    /0/100/2/0.1              multimedia  NVIDIA Corporation
    /0/100/4                  bridge      RD890/RD9x0/RX980 PCI to PCI bridge (PCI Express GPP Port 0)
    /0/100/4/0     enp2s0     network     RTL8111/8168/8411 PCI Express Gigabit Ethernet Controller
    /0/100/5                  bridge      RD890/RD9x0/RX980 PCI to PCI bridge (PCI Express GPP Port 1)
    /0/100/5/0                bus         ASM1042 SuperSpeed USB Host Controller
    /0/100/5/0/0   usb8       bus         xHCI Host Controller
    /0/100/5/0/1   usb9       bus         xHCI Host Controller
    /0/100/6                  bridge      RD890/RD9x0/RX980 PCI to PCI bridge (PCI Express GPP Port 2)
    /0/100/6/0                storage     JMB362 SATA Controller
    /0/100/7                  bridge      RD890/RD9x0/RX980 PCI to PCI bridge (PCI Express GPP Port 3)
    /0/100/7/0                bus         ASMedia Technology Inc.
    /0/100/7/0/0   usb10      bus         xHCI Host Controller
    /0/100/7/0/1   usb11      bus         xHCI Host Controller
    /0/100/a                  bridge      RD890/RD9x0/RX980 PCI to PCI bridge (PCI Express GPP Port 5)
    /0/100/a/0                storage     JMB362 SATA Controller
    /0/100/11                 storage     SB7x0/SB8x0/SB9x0 SATA Controller [AHCI mode]
    /0/100/12                 bus         SB7x0/SB8x0/SB9x0 USB OHCI0 Controller
    /0/100/12/1    usb4       bus         OHCI PCI host controller
    /0/100/12.2               bus         SB7x0/SB8x0/SB9x0 USB EHCI Controller
    /0/100/12.2/1  usb1       bus         EHCI Host Controller
    /0/100/13                 bus         SB7x0/SB8x0/SB9x0 USB OHCI0 Controller
    /0/100/13/1    usb5       bus         OHCI PCI host controller
    /0/100/13/1/3             input       USB Receiver
    /0/100/13.2               bus         SB7x0/SB8x0/SB9x0 USB EHCI Controller
    /0/100/13.2/1  usb2       bus         EHCI Host Controller
    /0/100/14                 bus         SBx00 SMBus Controller
    /0/100/14.2               multimedia  SBx00 Azalia (Intel HDA)
    /0/100/14.3               bridge      SB7x0/SB8x0/SB9x0 LPC host controller
    /0/100/14.4               bridge      SBx00 PCI to PCI Bridge
    /0/100/14.4/6             bus         VT6306/7/8 [Fire II(M)] IEEE 1394 OHCI Controller
    /0/100/14.5               bus         SB7x0/SB8x0/SB9x0 USB OHCI2 Controller
    /0/100/14.5/1  usb6       bus         OHCI PCI host controller
    /0/100/16                 bus         SB7x0/SB8x0/SB9x0 USB OHCI0 Controller
    /0/100/16/1    usb7       bus         OHCI PCI host controller
    /0/100/16.2               bus         SB7x0/SB8x0/SB9x0 USB EHCI Controller
    /0/100/16.2/1  usb3       bus         EHCI Host Controller
    /0/101                    bridge      Family 15h Processor Function 0
    /0/102                    bridge      Family 15h Processor Function 1
    /0/103                    bridge      Family 15h Processor Function 2
    /0/104                    bridge      Family 15h Processor Function 3
    /0/105                    bridge      Family 15h Processor Function 4
    /0/106                    bridge      Family 15h Processor Function 5
    /0/1           scsi1      storage     
    /0/1/0.0.0     /dev/sda   disk        1TB ST31000524AS
    /0/1/0.0.0/1   /dev/sda1  volume      931GiB EXT4 volume
    
    root@PC:~# lspci
    00:00.0 Host bridge: Advanced Micro Devices, Inc. [AMD/ATI] RD9x0/RX980 Host Bridge (rev 02)
    00:02.0 PCI bridge: Advanced Micro Devices, Inc. [AMD/ATI] RD890/RD9x0/RX980 PCI to PCI bridge (PCI Express GFX port 0)
    00:04.0 PCI bridge: Advanced Micro Devices, Inc. [AMD/ATI] RD890/RD9x0/RX980 PCI to PCI bridge (PCI Express GPP Port 0)
    00:05.0 PCI bridge: Advanced Micro Devices, Inc. [AMD/ATI] RD890/RD9x0/RX980 PCI to PCI bridge (PCI Express GPP Port 1)
    00:06.0 PCI bridge: Advanced Micro Devices, Inc. [AMD/ATI] RD890/RD9x0/RX980 PCI to PCI bridge (PCI Express GPP Port 2)
    00:07.0 PCI bridge: Advanced Micro Devices, Inc. [AMD/ATI] RD890/RD9x0/RX980 PCI to PCI bridge (PCI Express GPP Port 3)
    00:0a.0 PCI bridge: Advanced Micro Devices, Inc. [AMD/ATI] RD890/RD9x0/RX980 PCI to PCI bridge (PCI Express GPP Port 5)
    00:11.0 SATA controller: Advanced Micro Devices, Inc. [AMD/ATI] SB7x0/SB8x0/SB9x0 SATA Controller [AHCI mode] (rev 40)
    00:12.0 USB controller: Advanced Micro Devices, Inc. [AMD/ATI] SB7x0/SB8x0/SB9x0 USB OHCI0 Controller
    00:12.2 USB controller: Advanced Micro Devices, Inc. [AMD/ATI] SB7x0/SB8x0/SB9x0 USB EHCI Controller
    00:13.0 USB controller: Advanced Micro Devices, Inc. [AMD/ATI] SB7x0/SB8x0/SB9x0 USB OHCI0 Controller
    00:13.2 USB controller: Advanced Micro Devices, Inc. [AMD/ATI] SB7x0/SB8x0/SB9x0 USB EHCI Controller
    00:14.0 SMBus: Advanced Micro Devices, Inc. [AMD/ATI] SBx00 SMBus Controller (rev 42)
    00:14.2 Audio device: Advanced Micro Devices, Inc. [AMD/ATI] SBx00 Azalia (Intel HDA) (rev 40)
    00:14.3 ISA bridge: Advanced Micro Devices, Inc. [AMD/ATI] SB7x0/SB8x0/SB9x0 LPC host controller (rev 40)
    00:14.4 PCI bridge: Advanced Micro Devices, Inc. [AMD/ATI] SBx00 PCI to PCI Bridge (rev 40)
    00:14.5 USB controller: Advanced Micro Devices, Inc. [AMD/ATI] SB7x0/SB8x0/SB9x0 USB OHCI2 Controller
    00:16.0 USB controller: Advanced Micro Devices, Inc. [AMD/ATI] SB7x0/SB8x0/SB9x0 USB OHCI0 Controller
    00:16.2 USB controller: Advanced Micro Devices, Inc. [AMD/ATI] SB7x0/SB8x0/SB9x0 USB EHCI Controller
    00:18.0 Host bridge: Advanced Micro Devices, Inc. [AMD] Family 15h Processor Function 0
    00:18.1 Host bridge: Advanced Micro Devices, Inc. [AMD] Family 15h Processor Function 1
    00:18.2 Host bridge: Advanced Micro Devices, Inc. [AMD] Family 15h Processor Function 2
    00:18.3 Host bridge: Advanced Micro Devices, Inc. [AMD] Family 15h Processor Function 3
    00:18.4 Host bridge: Advanced Micro Devices, Inc. [AMD] Family 15h Processor Function 4
    00:18.5 Host bridge: Advanced Micro Devices, Inc. [AMD] Family 15h Processor Function 5
    01:00.0 VGA compatible controller: NVIDIA Corporation GP107 [GeForce GTX 1050 Ti] (rev a1)
    01:00.1 Audio device: NVIDIA Corporation GP107GL High Definition Audio Controller (rev a1)
    02:00.0 Ethernet controller: Realtek Semiconductor Co., Ltd. RTL8111/8168/8411 PCI Express Gigabit Ethernet Controller (rev 06)
    03:00.0 USB controller: ASMedia Technology Inc. ASM1042 SuperSpeed USB Host Controller
    04:00.0 SATA controller: JMicron Technology Corp. JMB362 SATA Controller (rev 10)
    05:00.0 USB controller: ASMedia Technology Inc. Device 1040
    06:00.0 SATA controller: JMicron Technology Corp. JMB362 SATA Controller (rev 10)
    07:06.0 FireWire (IEEE 1394): VIA Technologies, Inc. VT6306/7/8 [Fire II(M)] IEEE 1394 OHCI Controller (rev c0)
    

    Josef Kufner avatar 17.11.2018 09:29 Josef Kufner | skóre: 70
    Rozbalit Rozbalit vše Re: Změna IRQ pro komponentu
    Otázkou je, jakým způsobem ta integrovaná grafika odešla. Pokud špatným, tak může dělat velké potíže, i když jí nechceš používat. V BIOSu bývá povolování a zakazování integrovaných komponent. Důkladně tam vše okolo integrované grafiky zakaž. Možná klidně zakaž úplně všecko a povol jen to, co opravdu potřebuješ k bootu. Pokud to pomůže, tak postupně povoluj další věci.
    Hello world ! Segmentation fault (core dumped)
    17.11.2018 09:37 Ariczek | skóre: 5
    Rozbalit Rozbalit vše Re: Změna IRQ pro komponentu
    Není žádná integrovaná grafika - AMD FX8120 ji nemá. Měl jsem tam kartu Radeon tuším 6950 původně.
    Josef Kufner avatar 17.11.2018 09:41 Josef Kufner | skóre: 70
    Rozbalit Rozbalit vše Re: Změna IRQ pro komponentu
    Aha, tak to pak nemělo dělat potíže. Škrtni si tak třetinu toho, co jsem psal ;-)
    Hello world ! Segmentation fault (core dumped)
    16.11.2018 23:28 pc2005 | skóre: 38 | blog: GardenOfEdenConfiguration | liberec
    Rozbalit Rozbalit vše Re: Změna IRQ pro komponentu
    Legacy IRQ se dá nastavit manuálně před načtením driveru v konfiguračních registrech PCI "Interrupt Line". Například pomocí programu setpci. Ale je to hodně špinavé řešení. A nevím jak moc dobře to na x86/acpi funguje.

    Systém ti nabízí použití volby irqpoll. Zkus jí. Dneska by měly drivery používat MSI a ne legacy IRQ (PCIe byla s tím založená a dneska už moderní karty problém s MSI snad nemaj, leda tak HW před 10 lety).

    Z kernelu dále by mohla pomoct volba irqfixup, volby pro APIC (reroute apod) a možná pci rescan. Projdi si tenhle dokument.

    Ještě bys sem mohl hodit výpis příkazu
    modinfo nvidia
    (jestli se tedy driver jmenuje nvidia.ko, měl by), který vypíše všechny volby toho binárního blobu. Občas se najde nějaká zajímavá volba co to opraví (zrovna tenhle týden se díky volbám z modulu amdgpu rozchodil radeon na superobstarožním HW, který nepodporuje nějaké řízení spotřeby či co).

    Obecně vzato už roky a roky by linuxový driver neměl mít problém se sdíleným IRQ. Mechanismus funguje tak, že se driver koukne zda přerušení bylo vyvoláno jím spravovaným hardwarem a pokud jo, tak ho obslouží. Pokud ne, tak vrátí kód "já ne". U opensource kódu bych se kouknul do zdrojáků. U nvidia blobu to jaksi moc nepůjde (i když mám dojem, že si to kompiluje nějaký antiGPL wrappery).

    Osobně bych ale řekl, že tam bude ještě nějaky další problém. Ne jenom to IRQ. Takže nejlepší bude nahlásit chybu nvidii a pokud to nvidie neopraví do nějaké uspokojivé doby, tak jí v budoucnu vyjádřit nespokojenost svojí peněženkou ;-).
    17.11.2018 09:09 Ariczek | skóre: 5
    Rozbalit Rozbalit vše Re: Změna IRQ pro komponentu
    Mechanismus funguje tak, že se driver koukne zda přerušení bylo vyvoláno jím spravovaným hardwarem a pokud jo, tak ho obslouží. Pokud ne, tak vrátí kód "já ne".
    Hádám, že tohle se stane - že všechny drivery řeknou že to není pro ně.
    Osobně bych ale řekl, že tam bude ještě nějaky další problém.
    Jo, to já si myslím (i k okolnostem co píšu výše v komentu) taky, jen mě mate, že jediným rozdílem mezi "poměrně fungující" a "nepoužitelné" je zavedení driverů nvidia.

    Na ty ostatní body jdu kouknut do "nestabilního" světa. Díky.
    17.11.2018 10:29 Ariczek | skóre: 5
    Rozbalit Rozbalit vše Re: Změna IRQ pro komponentu
    Dávám výpis příkazu:
    root@PC:~# modinfo nvidia
    filename:       /lib/modules/4.15.0-39-generic/updates/dkms/nvidia.ko
    alias:          char-major-195-*
    version:        415.13
    supported:      external
    license:        NVIDIA
    srcversion:     FF48FAE0310141F01CD81A8
    alias:          pci:v000010DEd00000E00sv*sd*bc04sc80i00*
    alias:          pci:v000010DEd*sv*sd*bc03sc02i00*
    alias:          pci:v000010DEd*sv*sd*bc03sc00i00*
    depends:        ipmi_msghandler
    retpoline:      Y
    name:           nvidia
    vermagic:       4.15.0-39-generic SMP mod_unload 
    parm:           NvSwitchRegDwords:NvSwitch regkey (charp)
    parm:           NVreg_Mobile:int
    parm:           NVreg_ResmanDebugLevel:int
    parm:           NVreg_RmLogonRC:int
    parm:           NVreg_ModifyDeviceFiles:int
    parm:           NVreg_DeviceFileUID:int
    parm:           NVreg_DeviceFileGID:int
    parm:           NVreg_DeviceFileMode:int
    parm:           NVreg_UpdateMemoryTypes:int
    parm:           NVreg_InitializeSystemMemoryAllocations:int
    parm:           NVreg_UsePageAttributeTable:int
    parm:           NVreg_MapRegistersEarly:int
    parm:           NVreg_RegisterForACPIEvents:int
    parm:           NVreg_CheckPCIConfigSpace:int
    parm:           NVreg_EnablePCIeGen3:int
    parm:           NVreg_EnableMSI:int
    parm:           NVreg_TCEBypassMode:int
    parm:           NVreg_UseThreadedInterrupts:int
    parm:           NVreg_EnableStreamMemOPs:int
    parm:           NVreg_EnableBacklightHandler:int
    parm:           NVreg_EnableUserNUMAManagement:int
    parm:           NVreg_MemoryPoolSize:int
    parm:           NVreg_KMallocHeapMaxSize:int
    parm:           NVreg_VMallocHeapMaxSize:int
    parm:           NVreg_IgnoreMMIOCheck:int
    parm:           NVreg_RegistryDwords:charp
    parm:           NVreg_RegistryDwordsPerDevice:charp
    parm:           NVreg_RmMsg:charp
    parm:           NVreg_GpuBlacklist:charp
    parm:           NVreg_AssignGpus:charp
    
    root@PC:~# lsmod | grep nvidia
    nvidia_uvm            786432  0
    nvidia_drm             40960  7
    nvidia_modeset       1036288  13 nvidia_drm
    nvidia              17227776  581 nvidia_uvm,nvidia_modeset
    drm_kms_helper        172032  1 nvidia_drm
    drm                   401408  10 drm_kms_helper,nvidia_drm
    ipmi_msghandler        53248  2 ipmi_devintf,nvidia
    
    17.11.2018 20:21 pc2005 | skóre: 38 | blog: GardenOfEdenConfiguration | liberec
    Rozbalit Rozbalit vše Re: Změna IRQ pro komponentu
    Ještě můžeš zkusit to MSI naopak vypnout :-D. BTW tohle taky zasahuje do přerušení "NVreg_UseThreadedInterrupts".
    17.11.2018 09:34 dustin | skóre: 63 | blog: dustin
    Rozbalit Rozbalit vše Re: Změna IRQ pro komponentu
    Dle https://wiki.gentoo.org/wiki/NVidia/nvidia-drivers/en#Driver_fails_to_initialize_when_MSI_interrupts_are_enabled mají nvidia drivery MSI defaultně zapnuté. Ten link to také zapíná, možná proto to nemá žádný vliv.

    Zkusil bych naopak MSI vypnout. A určitě si nějak ověřuj, že se změna opravdu provede, než dojde k záhryzu. Třeba nějakým skriptem spuštěným hned po startu, ve smyčce do perzistentního souboru mezi booty (tedy ne /tmp u distribucí, které je mažou mezi booty.

    A taky bych vypsal obsah /proc/interrupts, než se to hryzne, zda bys z toho něco vykoukal. Očividně nemá nvidií driver rád sdílení IRQ.
    17.11.2018 21:06 Ariczek | skóre: 5
    Rozbalit Rozbalit vše Re: Změna IRQ pro komponentu
    Tu stránku chápu právě tak, že se zapne MSI - a tím se vypne přímo irq a nebude již sdíleno...
    17.11.2018 16:19 Ariczek | skóre: 5
    Rozbalit Rozbalit vše Re: Změna IRQ pro komponentu
    Hm, tak asi bych měl dotaz ohledně irq označit za vyřešený, ale stejně PC zamrzá...

    Udělal jsem update BIOS na poslední verzi:
    	Vendor: American Megatrends Inc.
    	Version: 1708
    	Release Date: 04/10/2013
    
    V BIOSu jsem vypnul zařízení Azalia. Hláška "nobody cared" se už v syslogu neukáže.

    Nicméně k zamrznutí stejně dojde, akorát teď zatím netuším, čeho se mám chytnout.

    K zamrznutí došlo v 15:36 (ten čas svítil na displeji), pro ten čas je v syslogu následující:
    Nov 17 15:36:08 PC /usr/lib/gdm3/gdm-x-session[1275]: (--) NVIDIA(GPU-0): Samsung SA300/350/360 (DFP-0): connected
    Nov 17 15:36:08 PC /usr/lib/gdm3/gdm-x-session[1275]: (--) NVIDIA(GPU-0): Samsung SA300/350/360 (DFP-0): Internal TMDS
    Nov 17 15:36:08 PC /usr/lib/gdm3/gdm-x-session[1275]: (--) NVIDIA(GPU-0): Samsung SA300/350/360 (DFP-0): 600.0 MHz maximum pixel clock
    Nov 17 15:36:08 PC /usr/lib/gdm3/gdm-x-session[1275]: (--) NVIDIA(GPU-0):
    Nov 17 15:36:08 PC /usr/lib/gdm3/gdm-x-session[1275]: (--) NVIDIA(GPU-0): DFP-1: disconnected
    Nov 17 15:36:08 PC /usr/lib/gdm3/gdm-x-session[1275]: (--) NVIDIA(GPU-0): DFP-1: Internal TMDS
    Nov 17 15:36:08 PC /usr/lib/gdm3/gdm-x-session[1275]: (--) NVIDIA(GPU-0): DFP-1: 165.0 MHz maximum pixel clock
    Nov 17 15:36:08 PC /usr/lib/gdm3/gdm-x-session[1275]: (--) NVIDIA(GPU-0):
    Nov 17 15:36:08 PC /usr/lib/gdm3/gdm-x-session[1275]: (--) NVIDIA(GPU-0): DFP-2: disconnected
    Nov 17 15:36:08 PC /usr/lib/gdm3/gdm-x-session[1275]: (--) NVIDIA(GPU-0): DFP-2: Internal DisplayPort
    Nov 17 15:36:08 PC /usr/lib/gdm3/gdm-x-session[1275]: (--) NVIDIA(GPU-0): DFP-2: 1440.0 MHz maximum pixel clock
    Nov 17 15:36:08 PC /usr/lib/gdm3/gdm-x-session[1275]: (--) NVIDIA(GPU-0):
    Nov 17 15:36:08 PC /usr/lib/gdm3/gdm-x-session[1275]: (--) NVIDIA(GPU-0): DFP-3: disconnected
    Nov 17 15:36:08 PC /usr/lib/gdm3/gdm-x-session[1275]: (--) NVIDIA(GPU-0): DFP-3: Internal TMDS
    Nov 17 15:36:08 PC /usr/lib/gdm3/gdm-x-session[1275]: (--) NVIDIA(GPU-0): DFP-3: 165.0 MHz maximum pixel clock
    Nov 17 15:36:08 PC /usr/lib/gdm3/gdm-x-session[1275]: (--) NVIDIA(GPU-0):
    Nov 17 15:36:08 PC /usr/lib/gdm3/gdm-x-session[1275]: (--) NVIDIA(GPU-0): DFP-4: disconnected
    Nov 17 15:36:08 PC /usr/lib/gdm3/gdm-x-session[1275]: (--) NVIDIA(GPU-0): DFP-4: Internal TMDS
    Nov 17 15:36:08 PC /usr/lib/gdm3/gdm-x-session[1275]: (--) NVIDIA(GPU-0): DFP-4: 330.0 MHz maximum pixel clock
    Nov 17 15:36:08 PC /usr/lib/gdm3/gdm-x-session[1275]: (--) NVIDIA(GPU-0):
    Nov 17 15:36:10 PC gnome-shell[1411]: [AppIndicatorSupport-DEBUG] Registering StatusNotifierItem :1.87/org/ayatana/NotificationItem/steam
    Nov 17 15:36:14 PC /usr/lib/gdm3/gdm-x-session[1275]: (--) NVIDIA(GPU-0): Samsung SA300/350/360 (DFP-0): connected
    Nov 17 15:36:14 PC /usr/lib/gdm3/gdm-x-session[1275]: (--) NVIDIA(GPU-0): Samsung SA300/350/360 (DFP-0): Internal TMDS
    Nov 17 15:36:14 PC /usr/lib/gdm3/gdm-x-session[1275]: (--) NVIDIA(GPU-0): Samsung SA300/350/360 (DFP-0): 600.0 MHz maximum pixel clock
    Nov 17 15:36:14 PC /usr/lib/gdm3/gdm-x-session[1275]: (--) NVIDIA(GPU-0):
    Nov 17 15:36:14 PC /usr/lib/gdm3/gdm-x-session[1275]: (--) NVIDIA(GPU-0): DFP-1: disconnected
    Nov 17 15:36:14 PC /usr/lib/gdm3/gdm-x-session[1275]: (--) NVIDIA(GPU-0): DFP-1: Internal TMDS
    Nov 17 15:36:14 PC /usr/lib/gdm3/gdm-x-session[1275]: (--) NVIDIA(GPU-0): DFP-1: 165.0 MHz maximum pixel clock
    Nov 17 15:36:14 PC /usr/lib/gdm3/gdm-x-session[1275]: (--) NVIDIA(GPU-0):
    Nov 17 15:36:14 PC /usr/lib/gdm3/gdm-x-session[1275]: (--) NVIDIA(GPU-0): DFP-2: disconnected
    Nov 17 15:36:14 PC /usr/lib/gdm3/gdm-x-session[1275]: (--) NVIDIA(GPU-0): DFP-2: Internal DisplayPort
    Nov 17 15:36:14 PC /usr/lib/gdm3/gdm-x-session[1275]: (--) NVIDIA(GPU-0): DFP-2: 1440.0 MHz maximum pixel clock
    Nov 17 15:36:14 PC /usr/lib/gdm3/gdm-x-session[1275]: (--) NVIDIA(GPU-0):
    Nov 17 15:36:14 PC /usr/lib/gdm3/gdm-x-session[1275]: (--) NVIDIA(GPU-0): DFP-3: disconnected
    Nov 17 15:36:14 PC /usr/lib/gdm3/gdm-x-session[1275]: (--) NVIDIA(GPU-0): DFP-3: Internal TMDS
    Nov 17 15:36:14 PC /usr/lib/gdm3/gdm-x-session[1275]: (--) NVIDIA(GPU-0): DFP-3: 165.0 MHz maximum pixel clock
    Nov 17 15:36:14 PC /usr/lib/gdm3/gdm-x-session[1275]: (--) NVIDIA(GPU-0):
    Nov 17 15:36:14 PC /usr/lib/gdm3/gdm-x-session[1275]: (--) NVIDIA(GPU-0): DFP-4: disconnected
    Nov 17 15:36:14 PC /usr/lib/gdm3/gdm-x-session[1275]: (--) NVIDIA(GPU-0): DFP-4: Internal TMDS
    Nov 17 15:36:14 PC /usr/lib/gdm3/gdm-x-session[1275]: (--) NVIDIA(GPU-0): DFP-4: 330.0 MHz maximum pixel clock
    Nov 17 15:36:14 PC /usr/lib/gdm3/gdm-x-session[1275]: (--) NVIDIA(GPU-0):
    Nov 17 15:36:52 PC kernel: [  408.993044] NVRM: GPU at PCI:0000:01:00: GPU-29cefe64-549a-0429-9f52-67763574938b
    Nov 17 15:36:52 PC kernel: [  408.993050] NVRM: GPU Board Serial Number: 
    Nov 17 15:36:52 PC kernel: [  408.993057] NVRM: Xid (PCI:0000:01:00): 16, Head 00000000 Count 00009fd4
    Nov 17 15:36:53 PC kernel: [  410.017212] NVRM: Xid (PCI:0000:01:00): 8, Channel 00000028
    Nov 17 15:37:01 PC kernel: [  418.209302] NVRM: Xid (PCI:0000:01:00): 8, Channel 00000020
    Nov 17 15:37:06 PC kernel: [  423.361191] NVRM: Xid (PCI:0000:01:00): 16, Head 00000000 Count 00009fe2
    Nov 17 15:37:16 PC kernel: [  433.601311] NVRM: Xid (PCI:0000:01:00): 16, Head 00000000 Count 00009fe9
    Nov 17 15:37:27 PC kernel: [  443.841333] NVRM: Xid (PCI:0000:01:00): 16, Head 00000000 Count 00009fee
    Nov 17 15:37:37 PC kernel: [  454.081434] NVRM: Xid (PCI:0000:01:00): 16, Head 00000000 Count 00009ff4
    Nov 17 15:37:45 PC kernel: [  462.273597] NVRM: Xid (PCI:0000:01:00): 16, Head 00000000 Count 00009ff5
    
    17.11.2018 20:40 pc2005 | skóre: 38 | blog: GardenOfEdenConfiguration | liberec
    Rozbalit Rozbalit vše Re: Změna IRQ pro komponentu
    Hele tohle naopak s přerušením souvisí. Sice nemusí být ty errory s přerušením zdroj chyby ale jen symptom, ale souviset to IMO bude. BTW chování, kdy je na jednom přerušení jen jedno zařízení se může teoreticky zpracovávat jinak (a hláška nebude vypisována).

    Poslední řádky logu bude nějaké hlášení o obsazenosti nějakého FIFO na komunikaci s jádry na GPU. "Head" bude start platných dat a "Count" obsazenost té fronty. Jak vidíš, tak obsazenost roste a na hodnotě nejspíš 0x9fff se to zasekne. Vypadá to, že maximální délka té fronty bude 0xa000. Zároveň to vypadá, že nic z té fronty není odebíráno, protože to by pak rostla i "Head" hodnota. Obvykle jsou nová data ve frontě oznamována přerušením, takže pokud to přerušení něco ignoruje, tak nic ty data nebude odebírat.

    Je to teda jen hypotéza, ale něco podobnýho dělala i nějaká prehistorická ATI radeon (se kterým jsem si tuhle hrál) a ručně se jí vypne IRQ (její opensource driver má ale dost ochranných mechanismů aby se nesekl systém).

    Jestli to pravidelně mrzne do třeba 10 minut, tak zkus ukládat výpisy z /proc/interrupts. Podle zběžného pohledu do kernelu by tam měly být obrovské hodnoty u spurious interrupts (ta hláška ze začátku se vypíše snad až při 10k ignorovanejch přerušení).

    P.S. Sice tohle je jen hypotéza, ale alespoň by to mohlo pomoct při nahlašování té chyby nějakému maintaineru nvidia blobu.
    17.11.2018 22:22 Ariczek | skóre: 5
    Rozbalit Rozbalit vše Re: Změna IRQ pro komponentu
    Tak teď se mi to chovalo divně víc než obvykle. Nejdřív to běželo dlouho (cca 15 minut) bez problému, pak to zamrzlo ještě 2x (myš se mi většinou hýbe ale OS nereaguje).

    První zámrz byl ve 21:39. Syslog končí zmáčknutím reset.
    Nov 17 21:38:31 PC org.gnome.Shell.desktop[1563]: Window manager warning: Buggy client sent a _NET_ACTIVE_WINDOW message with a timestamp of 0 for 0x2400010 (Prison Arc)
    Nov 17 21:39:01 PC CRON[3802]: (root) CMD (  [ -x /usr/lib/php/sessionclean ] && if [ ! -d /run/systemd/system ]; then /usr/lib/php/sessionclean; fi)
    Nov 17 21:39:14 PC kernel: [  864.650726] NVRM: GPU at PCI:0000:01:00: GPU-29cefe64-549a-0429-9f52-67763574938b
    Nov 17 21:39:14 PC kernel: [  864.650729] NVRM: GPU Board Serial Number: 
    Nov 17 21:39:14 PC kernel: [  864.650731] NVRM: Xid (PCI:0000:01:00): 8, Channel 00000040
    Nov 17 21:39:25 PC systemd[1]: Starting Clean php session files...
    Nov 17 21:39:25 PC systemd[1]: Started Clean php session files.
    Nov 17 21:39:26 PC kernel: [  877.002768] NVRM: Xid (PCI:0000:01:00): 16, Head 00000000 Count 000171cc
    Nov 17 21:39:31 PC /usr/lib/gdm3/gdm-x-session[1427]: (II) event5  - Logitech M705: SYN_DROPPED event - some input events have been lost.
    Nov 17 21:40:25 PC systemd[1]: Starting Cleanup of Temporary Directories...
    Nov 17 21:40:25 PC systemd[1]: Started Cleanup of Temporary Directories.
    Nov 17 21:40:45 PC /usr/lib/gdm3/gdm-x-session[1427]: (EE) NVIDIA(0): The NVIDIA X driver has encountered an error; attempting to
    Nov 17 21:40:45 PC /usr/lib/gdm3/gdm-x-session[1427]: (EE) NVIDIA(0):     recover...
    Nov 17 21:40:45 PC kernel: [  955.852043] NVRM: Xid (PCI:0000:01:00): 8, Channel 00000018
    Nov 17 21:40:47 PC kernel: [  957.851813] NVRM: os_schedule: Attempted to yield the CPU while in atomic or interrupt context
    Nov 17 21:40:49 PC kernel: [  959.851907] NVRM: os_schedule: Attempted to yield the CPU while in atomic or interrupt context
    Nov 17 21:40:49 PC /usr/lib/gdm3/gdm-x-session[1427]: (II) event5  - Logitech M705: SYN_DROPPED event - some input events have been lost.
    Nov 17 21:40:52 PC kernel: [  962.858950] nvidia-modeset: WARNING: GPU:0: Lost display notification (0:0x00000000); continuing.
    Nov 17 21:40:57 PC kernel: [  968.268098] NVRM: Xid (PCI:0000:01:00): 8, Channel 0000001a
    Nov 17 21:40:59 PC kernel: [  970.268029] NVRM: os_schedule: Attempted to yield the CPU while in atomic or interrupt context
    Nov 17 21:41:01 PC kernel: [  972.268007] NVRM: os_schedule: Attempted to yield the CPU while in atomic or interrupt context
    Nov 17 21:41:08 PC kernel: [  978.508189] NVRM: Xid (PCI:0000:01:00): 16, Head 00000000 Count 00017557
    Nov 17 21:41:10 PC kernel: [  980.556366] NVRM: Xid (PCI:0000:01:00): 8, Channel 0000001a
    Nov 17 21:41:12 PC kernel: [  982.556134] NVRM: os_schedule: Attempted to yield the CPU while in atomic or interrupt context
    Nov 17 21:41:14 PC kernel: [  984.556163] NVRM: os_schedule: Attempted to yield the CPU while in atomic or interrupt context
    Nov 17 21:41:22 PC kernel: [  992.844537] NVRM: Xid (PCI:0000:01:00): 8, Channel 0000001a
    Nov 17 21:41:24 PC kernel: [  994.844296] NVRM: os_schedule: Attempted to yield the CPU while in atomic or interrupt context
    Nov 17 21:41:26 PC kernel: [  996.844334] NVRM: os_schedule: Attempted to yield the CPU while in atomic or interrupt context
    Nov 17 21:41:34 PC kernel: [ 1005.136550] NVRM: Xid (PCI:0000:01:00): 8, Channel 0000001a
    Nov 17 21:41:36 PC kernel: [ 1007.136452] NVRM: os_schedule: Attempted to yield the CPU while in atomic or interrupt context
    Nov 17 21:41:38 PC kernel: [ 1009.136482] NVRM: os_schedule: Attempted to yield the CPU while in atomic or interrupt context
    Nov 17 21:41:46 PC kernel: [ 1017.420880] NVRM: Xid (PCI:0000:01:00): 8, Channel 0000001a
    Nov 17 21:41:48 PC kernel: [ 1019.420673] NVRM: os_schedule: Attempted to yield the CPU while in atomic or interrupt context
    Nov 17 21:41:50 PC kernel: [ 1021.420703] NVRM: os_schedule: Attempted to yield the CPU while in atomic or interrupt context
    Nov 17 21:41:59 PC kernel: [ 1029.708889] NVRM: Xid (PCI:0000:01:00): 8, Channel 0000001a
    Nov 17 21:42:01 PC kernel: [ 1031.708772] NVRM: os_schedule: Attempted to yield the CPU while in atomic or interrupt context
    Nov 17 21:42:03 PC kernel: [ 1033.708800] NVRM: os_schedule: Attempted to yield the CPU while in atomic or interrupt context
    Nov 17 21:42:11 PC kernel: [ 1041.997173] NVRM: Xid (PCI:0000:01:00): 8, Channel 0000001a
    K tomuhle mám /proc/interrupts vývoj vždy po 20s, poslední se udělal někdy 21:41. Spurious nejsou.
                CPU0       CPU1       CPU2       CPU3       CPU4       CPU5       CPU6       CPU7       
       0:         35          0          0          0          0          0          0          0   IO-APIC    2-edge      timer
       8:          1          0          0          0          0          0          0          0   IO-APIC    8-edge      rtc0
       9:          0          0          0          0          0          0          0          0   IO-APIC    9-fasteoi   acpi
      17:          0          0          0          0          0          0          0          0   IO-APIC   17-fasteoi   ehci_hcd:usb1
      18:          0          0          0          0          0          2          0          0   IO-APIC   18-fasteoi   ohci_hcd:usb4, ohci_hcd:usb6
      19:          0      36833          0          0          0          0          0          0   IO-APIC   19-fasteoi   ahci[0000:00:11.0]
      20:        257          0          0          0      20326          0       2100          0   IO-APIC   20-fasteoi   ohci_hcd:usb5
      21:          0          0          0          3          0          0          0          0   IO-APIC   21-fasteoi   ehci_hcd:usb2, firewire_ohci
      22:          0          0          0          0          0          0          0          1   IO-APIC   22-fasteoi   ohci_hcd:usb7
      23:          0          0          0          0          0          0          0          0   IO-APIC   23-fasteoi   ehci_hcd:usb3
      28:          0          0          0          0          0          0          0          0   PCI-MSI 1572864-edge      xhci_hcd
      29:          0          0          0          0          0          0          0          0   PCI-MSI 1572865-edge      xhci_hcd
      30:          0          0          0          0          0          0          0          0   PCI-MSI 1572866-edge      xhci_hcd
      31:          0          0          0          0          0          0          0          0   PCI-MSI 1572867-edge      xhci_hcd
      32:          0          0          0          0          0          0          0          0   PCI-MSI 1572868-edge      xhci_hcd
      33:          0          0          0          0          0          0          0          0   PCI-MSI 1572869-edge      xhci_hcd
      34:          0          0          0          0          0          0          0          0   PCI-MSI 1572870-edge      xhci_hcd
      35:          0          0          0          0          0          0          0          0   PCI-MSI 1572871-edge      xhci_hcd
      37:          0          0          0          0          0          0          0          0   PCI-MSI 2621440-edge      xhci_hcd
      38:          0          0          0          0          0          0          0          0   PCI-MSI 2621441-edge      xhci_hcd
      39:          0          0          0          0          0          0          0          0   PCI-MSI 2621442-edge      xhci_hcd
      40:          0          0          0          0          0          0          0          0   PCI-MSI 2621443-edge      xhci_hcd
      41:          0          0          0          0          0          0          0          0   PCI-MSI 2621444-edge      xhci_hcd
      42:          0          0          0          0          0          0          0          0   PCI-MSI 2621445-edge      xhci_hcd
      43:          0          0          0          0          0          0          0          0   PCI-MSI 2621446-edge      xhci_hcd
      44:          0          0          0          0          0          0          0          0   PCI-MSI 2621447-edge      xhci_hcd
      46:          0          0          0          0          0        180          0      41741   PCI-MSI 1048576-edge      enp2s0
      47:          0          0          0          0          0          0          0          0   IO-APIC   27-fasteoi   ahci[0000:04:00.0]
      48:          0          0          0          0          0          0          0          0   IO-APIC   23-fasteoi   ahci[0000:06:00.0]
      50:          0          0          0          0         79          0          0          0   IO-APIC    1-fasteoi   snd_hda_intel:card0
      51:          0          0          0          0          0      88539         35          0   PCI-MSI 524288-edge      nvidia
     NMI:          9          8         16         10         13          9         13          8   Non-maskable interrupts
     LOC:     102245      71071     109590      56051     103830      48698     106425      60217   Local timer interrupts
     SPU:          0          0          0          0          0          0          0          0   Spurious interrupts
     PMI:          9          8         16         10         13          9         13          8   Performance monitoring interrupts
     IWI:      57076      39080      52083      31024      52377      61818      52029      32756   IRQ work interrupts
     RTR:          0          0          0          0          0          0          0          0   APIC ICR read retries
     RES:     298806     182894     265325     175879     235272     145990     250845     171069   Rescheduling interrupts
     CAL:      42992      25522      38136      29036      41245      28318      39200      28582   Function call interrupts
     TLB:      40024      23042      35540      25928      38285      25226      36236      25624   TLB shootdowns
     TRM:          0          0          0          0          0          0          0          0   Thermal event interrupts
     THR:          0          0          0          0          0          0          0          0   Threshold APIC interrupts
     DFR:          0          0          0          0          0          0          0          0   Deferred Error APIC interrupts
     MCE:          0          0          0          0          0          0          0          0   Machine check exceptions
     MCP:          4          4          4          4          4          4          4          4   Machine check polls
     HYP:          0          0          0          0          0          0          0          0   Hypervisor callback interrupts
     ERR:         49
     MIS:          0
     PIN:          0          0          0          0          0          0          0          0   Posted-interrupt notification event
     NPI:          0          0          0          0          0          0          0          0   Nested posted-interrupt event
     PIW:          0          0          0          0          0          0          0          0   Posted-interrupt wakeup event
    
    K druhýmu zamrznutí došlo někde ve 21:44, dřív než jsem vůbec stihnul si vzít logy. Níže opět do hard resetu:
    Nov 17 21:44:00 PC /usr/lib/gdm3/gdm-x-session[986]: (--) NVIDIA(GPU-0): Samsung SA300/350/360 (DFP-0): connected
    Nov 17 21:44:00 PC /usr/lib/gdm3/gdm-x-session[986]: (--) NVIDIA(GPU-0): Samsung SA300/350/360 (DFP-0): Internal TMDS
    Nov 17 21:44:00 PC /usr/lib/gdm3/gdm-x-session[986]: (--) NVIDIA(GPU-0): Samsung SA300/350/360 (DFP-0): 600.0 MHz maximum pixel clock
    Nov 17 21:44:00 PC /usr/lib/gdm3/gdm-x-session[986]: (--) NVIDIA(GPU-0):
    Nov 17 21:44:00 PC /usr/lib/gdm3/gdm-x-session[986]: (--) NVIDIA(GPU-0): DFP-1: disconnected
    Nov 17 21:44:00 PC /usr/lib/gdm3/gdm-x-session[986]: (--) NVIDIA(GPU-0): DFP-1: Internal TMDS
    Nov 17 21:44:00 PC /usr/lib/gdm3/gdm-x-session[986]: (--) NVIDIA(GPU-0): DFP-1: 165.0 MHz maximum pixel clock
    Nov 17 21:44:00 PC /usr/lib/gdm3/gdm-x-session[986]: (--) NVIDIA(GPU-0):
    Nov 17 21:44:00 PC /usr/lib/gdm3/gdm-x-session[986]: (--) NVIDIA(GPU-0): DFP-2: disconnected
    Nov 17 21:44:00 PC /usr/lib/gdm3/gdm-x-session[986]: (--) NVIDIA(GPU-0): DFP-2: Internal DisplayPort
    Nov 17 21:44:00 PC /usr/lib/gdm3/gdm-x-session[986]: (--) NVIDIA(GPU-0): DFP-2: 1440.0 MHz maximum pixel clock
    Nov 17 21:44:00 PC /usr/lib/gdm3/gdm-x-session[986]: (--) NVIDIA(GPU-0):
    Nov 17 21:44:00 PC /usr/lib/gdm3/gdm-x-session[986]: (--) NVIDIA(GPU-0): DFP-3: disconnected
    Nov 17 21:44:00 PC /usr/lib/gdm3/gdm-x-session[986]: (--) NVIDIA(GPU-0): DFP-3: Internal TMDS
    Nov 17 21:44:00 PC /usr/lib/gdm3/gdm-x-session[986]: (--) NVIDIA(GPU-0): DFP-3: 165.0 MHz maximum pixel clock
    Nov 17 21:44:00 PC /usr/lib/gdm3/gdm-x-session[986]: (--) NVIDIA(GPU-0):
    Nov 17 21:44:00 PC /usr/lib/gdm3/gdm-x-session[986]: (--) NVIDIA(GPU-0): DFP-4: disconnected
    Nov 17 21:44:00 PC /usr/lib/gdm3/gdm-x-session[986]: (--) NVIDIA(GPU-0): DFP-4: Internal TMDS
    Nov 17 21:44:00 PC /usr/lib/gdm3/gdm-x-session[986]: (--) NVIDIA(GPU-0): DFP-4: 330.0 MHz maximum pixel clock
    Nov 17 21:44:00 PC /usr/lib/gdm3/gdm-x-session[986]: (--) NVIDIA(GPU-0):
    Nov 17 21:44:18 PC systemd[1]: Starting Stop ureadahead data collection...
    Nov 17 21:44:18 PC systemd[1]: Started Stop ureadahead data collection.
    Nov 17 21:44:18 PC kernel: [   85.175289] logitech-hidpp-device 0003:046D:2011.0005: HID++ 1.0 device connected.
    Nov 17 21:44:19 PC upowerd[898]: treating change event as add on /sys/devices/pci0000:00/0000:00:13.0/usb5/5-3/5-3:1.2/0003:046D:C52B.0003/0003:046D:2011.0005/power_supply/hidpp_battery_1
    Nov 17 21:44:19 PC /usr/lib/gdm3/gdm-x-session[986]: (**) Option "fd" "39"
    Nov 17 21:44:19 PC /usr/lib/gdm3/gdm-x-session[986]: (II) event1  - Power Button: device removed
    Nov 17 21:44:19 PC /usr/lib/gdm3/gdm-x-session[986]: (**) Option "fd" "42"
    Nov 17 21:44:19 PC /usr/lib/gdm3/gdm-x-session[986]: (II) event0  - Power Button: device removed
    Nov 17 21:44:19 PC /usr/lib/gdm3/gdm-x-session[986]: (**) Option "fd" "43"
    Nov 17 21:44:19 PC /usr/lib/gdm3/gdm-x-session[986]: (II) event5  - Logitech M705: device removed
    Nov 17 21:44:19 PC /usr/lib/gdm3/gdm-x-session[986]: (**) Option "fd" "44"
    Nov 17 21:44:19 PC /usr/lib/gdm3/gdm-x-session[986]: (II) event2  - Logitech M310: device removed
    Nov 17 21:44:19 PC /usr/lib/gdm3/gdm-x-session[986]: (**) Option "fd" "45"
    Nov 17 21:44:19 PC /usr/lib/gdm3/gdm-x-session[986]: (**) Option "fd" "46"
    Nov 17 21:44:19 PC /usr/lib/gdm3/gdm-x-session[986]: (II) event3  - Logitech M185: device removed
    Nov 17 21:44:19 PC /usr/lib/gdm3/gdm-x-session[986]: (**) Option "fd" "47"
    Nov 17 21:44:19 PC /usr/lib/gdm3/gdm-x-session[986]: (II) event6  - Eee PC WMI hotkeys: device removed
    Nov 17 21:44:19 PC /usr/lib/gdm3/gdm-x-session[986]: (**) Option "fd" "45"
    Nov 17 21:44:19 PC /usr/lib/gdm3/gdm-x-session[986]: (II) event4  - Logitech K520: device removed
    Nov 17 21:44:22 PC kernel: [   88.710117] nvidia-modeset: WARNING: GPU:0: Lost display notification (0:0x00000000); continuing.
    Nov 17 21:44:24 PC kernel: [   90.710945] nvidia-modeset: ERROR: GPU:0: Idling display engine timed out: 0x0000987d:0:0
    Nov 17 21:44:26 PC kernel: [   92.710203] nvidia-modeset: ERROR: GPU:0: Idling display engine timed out: 0x0000917e:0:0
    Nov 17 21:44:28 PC kernel: [   94.711417] nvidia-modeset: ERROR: GPU:0: Idling display engine timed out: 0x0000987d:0:0
    Nov 17 21:44:30 PC kernel: [   96.710834] nvidia-modeset: ERROR: GPU:0: Idling display engine timed out: 0x0000917e:0:0
    Nov 17 21:44:33 PC kernel: [   99.745501] nvidia-modeset: WARNING: GPU:0: Lost display notification (0:0x00000000); continuing.
    Nov 17 21:44:33 PC /usr/lib/gdm3/gdm-x-session[986]: (II) systemd-logind: got pause for 13:64
    Nov 17 21:44:33 PC /usr/lib/gdm3/gdm-x-session[986]: (II) systemd-logind: got pause for 13:65
    Nov 17 21:44:33 PC /usr/lib/gdm3/gdm-x-session[986]: (II) systemd-logind: got pause for 13:67
    Nov 17 21:44:33 PC /usr/lib/gdm3/gdm-x-session[986]: (II) systemd-logind: got pause for 13:66
    Nov 17 21:44:33 PC /usr/lib/gdm3/gdm-x-session[986]: (II) systemd-logind: got pause for 13:70
    Nov 17 21:44:33 PC /usr/lib/gdm3/gdm-x-session[986]: (II) systemd-logind: got pause for 13:69
    Nov 17 21:44:33 PC /usr/lib/gdm3/gdm-x-session[986]: (II) systemd-logind: got pause for 13:68
    Nov 17 21:44:33 PC systemd[1]: Started Getty on tty3.
    Nov 17 21:44:33 PC systemd[974]: Starting Sound Service...
    Nov 17 21:44:33 PC dbus-daemon[725]: [system] Activating via systemd: service name='org.freedesktop.RealtimeKit1' unit='rtkit-daemon.service' requested by ':1.43' (uid=121 pid=1133 comm="/usr/bin/p
    ulseaudio --daemonize=no " label="unconfined")
    Nov 17 21:44:33 PC systemd[1]: Starting RealtimeKit Scheduling Policy Service...
    Nov 17 21:44:33 PC dbus-daemon[725]: [system] Successfully activated service 'org.freedesktop.RealtimeKit1'
    Nov 17 21:44:33 PC systemd[1]: Started RealtimeKit Scheduling Policy Service.
    Nov 17 21:44:33 PC rtkit-daemon[1134]: Successfully called chroot.
    Nov 17 21:44:33 PC rtkit-daemon[1134]: Successfully dropped privileges.
    Nov 17 21:44:33 PC rtkit-daemon[1134]: Successfully limited resources.
    Nov 17 21:44:33 PC rtkit-daemon[1134]: Running.
    Nov 17 21:44:33 PC rtkit-daemon[1134]: Canary thread running.
    Nov 17 21:44:33 PC rtkit-daemon[1134]: Watchdog thread running.
    Nov 17 21:44:33 PC dbus-daemon[725]: [system] Activating via systemd: service name='org.bluez' unit='dbus-org.bluez.service' requested by ':1.55' (uid=121 pid=1133 comm="/usr/bin/pulseaudio --daemo
    nize=no " label="unconfined")
    Nov 17 21:44:34 PC systemd[974]: Started Sound Service.
    Nov 17 21:44:34 PC dbus-daemon[725]: [system] Activating via systemd: service name='org.freedesktop.locale1' unit='dbus-org.freedesktop.locale1.service' requested by ':1.42' (uid=121 pid=1120 comm=
    "/usr/bin/gnome-shell " label="unconfined")
    Nov 17 21:44:34 PC systemd[1]: Starting Locale Service...
    Nov 17 21:44:35 PC dbus-daemon[725]: [system] Successfully activated service 'org.freedesktop.locale1'
    Nov 17 21:44:35 PC systemd[1]: Started Locale Service.
    Nov 17 21:44:35 PC dbus-daemon[1077]: [session uid=121 pid=1077] Activating service name='org.freedesktop.portal.IBus' requested by ':1.18' (uid=121 pid=1152 comm="ibus-daemon --xim --panel disable
     " label="unconfined")
    Nov 17 21:44:35 PC dbus-daemon[1077]: [session uid=121 pid=1077] Successfully activated service 'org.freedesktop.portal.IBus'
    Nov 17 21:44:35 PC dbus-daemon[725]: [system] Activating via systemd: service name='org.freedesktop.GeoClue2' unit='geoclue.service' requested by ':1.42' (uid=121 pid=1120 comm="/usr/bin/gnome-shel
    l " label="unconfined")
    Nov 17 21:44:35 PC systemd[1]: Starting Location Lookup Service...
    Nov 17 21:44:35 PC dbus-daemon[725]: [system] Activating via systemd: service name='org.freedesktop.bolt' unit='bolt.service' requested by ':1.42' (uid=121 pid=1120 comm="/usr/bin/gnome-shell " lab
    el="unconfined")
    Nov 17 21:44:35 PC dbus-daemon[725]: [system] Successfully activated service 'org.freedesktop.GeoClue2'
    Nov 17 21:44:35 PC systemd[1]: Starting Thunderbolt system service...
    Nov 17 21:44:35 PC systemd[1]: Started Location Lookup Service.
    Nov 17 21:44:35 PC dbus-daemon[725]: [system] Activating via systemd: service name='org.freedesktop.PackageKit' unit='packagekit.service' requested by ':1.42' (uid=121 pid=1120 comm="/usr/bin/gnome
    -shell " label="unconfined")
    Nov 17 21:44:35 PC systemd[1]: Starting PackageKit Daemon...
    Nov 17 21:44:35 PC spice-vdagent[1181]: Cannot access vdagent virtio channel /dev/virtio-ports/com.redhat.spice.0
    Nov 17 21:44:35 PC boltd[1176]: bolt 0.4 starting up.
    Nov 17 21:44:35 PC boltd[1176]: config: loading user config
    Nov 17 21:44:35 PC boltd[1176]: store: loading devices
    Nov 17 21:44:35 PC gnome-session[1083]: gnome-session-binary[1083]: WARNING: App 'spice-vdagent.desktop' exited with code 1
    Nov 17 21:44:35 PC gnome-session-binary[1083]: WARNING: App 'spice-vdagent.desktop' exited with code 1
    Nov 17 21:44:35 PC boltd[1176]: power: force_power support: no
    Nov 17 21:44:35 PC boltd[1176]: udev: enumerating devices
    Nov 17 21:44:35 PC dbus-daemon[725]: [system] Successfully activated service 'org.freedesktop.bolt'
    Nov 17 21:44:35 PC systemd[1]: Started Thunderbolt system service.
    Nov 17 21:44:35 PC dbus-daemon[725]: [system] Activating via systemd: service name='org.freedesktop.hostname1' unit='dbus-org.freedesktop.hostname1.service' requested by ':1.60' (uid=121 pid=1193 c
    omm="/usr/lib/gnome-settings-daemon/gsd-media-keys " label="unconfined")
    Nov 17 21:44:35 PC systemd[1]: Starting Hostname Service...
    Nov 17 21:44:35 PC PackageKit: daemon start
    Nov 17 21:44:36 PC dbus-daemon[725]: [system] Activating via systemd: service name='org.freedesktop.ColorManager' unit='colord.service' requested by ':1.64' (uid=121 pid=1185 comm="/usr/lib/gnome-settings-daemon/gsd-color " label="unconfined")
    Nov 17 21:44:36 PC gnome-session-binary[1083]: Entering running state
    Nov 17 21:44:36 PC systemd[1]: Starting Manage, Install and Generate Color Profiles...
    Nov 17 21:44:36 PC dbus-daemon[725]: [system] Successfully activated service 'org.freedesktop.hostname1'
    Nov 17 21:44:36 PC systemd[1]: Started Hostname Service.
    Nov 17 21:44:36 PC xbrlapi.desktop[1259]: openConnection: connect: No such file or directory
    Nov 17 21:44:36 PC xbrlapi.desktop[1259]: cannot connect to braille devices daemon brltty at :0
    Nov 17 21:44:36 PC dbus-daemon[725]: [system] Successfully activated service 'org.freedesktop.ColorManager'
    Nov 17 21:44:36 PC systemd[1]: Started Manage, Install and Generate Color Profiles.
    Nov 17 21:44:36 PC gnome-shell[1120]: Error looking up permission: GDBus.Error:org.freedesktop.DBus.Error.ServiceUnknown: The name org.freedesktop.impl.portal.PermissionStore was not provided by any .service files
    Nov 17 21:44:36 PC dbus-daemon[725]: [system] Successfully activated service 'org.freedesktop.PackageKit'
    Nov 17 21:44:36 PC systemd[1]: Started PackageKit Daemon.
    Nov 17 21:44:36 PC gnome-shell[1120]: JS WARNING: [resource:///org/gnome/shell/ui/layout.js 29]: reference to undefined property "MetaWindowX11"
    Nov 17 21:44:36 PC gnome-shell[1120]: clutter-offscreen-effect.c:205: Unable to create an Offscreen buffer
    Nov 17 21:44:37 PC gsd-color[1185]: failed to obtain org.freedesktop.color-manager.create-profile auth
    Nov 17 21:44:37 PC gsd-color[1185]: failed to create device: failed to obtain org.freedesktop.color-manager.create-device auth
    Nov 17 21:44:37 PC gnome-shell[1120]: clutter-offscreen-effect.c:205: Unable to create an Offscreen buffer
    Nov 17 21:44:46 PC kernel: [  112.262664] NVRM: GPU at PCI:0000:01:00: GPU-29cefe64-549a-0429-9f52-67763574938b
    Nov 17 21:44:46 PC kernel: [  112.262699] NVRM: GPU Board Serial Number: 
    Nov 17 21:44:46 PC kernel: [  112.262710] NVRM: Xid (PCI:0000:01:00): 16, Head 00000000 Count 0000000a
    Nov 17 21:44:50 PC kernel: [  116.358337] NVRM: Xid (PCI:0000:01:00): 8, Channel 00000008
    Nov 17 21:44:54 PC kernel: [  120.453774] NVRM: Xid (PCI:0000:01:00): 16, Head 00000000 Count 0000000b
    Nov 17 21:44:38 PC gnome-shell[1120]: message repeated 54 times: [ clutter-offscreen-effect.c:205: Unable to create an Offscreen buffer]
    Nov 17 21:45:00 PC gnome-shell[1120]: clutter-offscreen-effect.c:205: Unable to create an Offscreen buffer
    Ještě jsem se pokusil vyčíst parametry modulů ze /sys/module/$module/parameters/. Tady mě trochu zaráží, že moduly nvidia a nvidia_modeset nemají žádné. Takže si neumím ověřit aktuální hodnoty vstupů dle modinfo...
    Module: nvidia_drm
    Parameter: modeset --> N
    
    Module: nvidia_uvm
    Parameter: uvm8_ats_mode --> -1
    Parameter: uvm_channel_gpfifo_loc --> auto
    Parameter: uvm_channel_gpput_loc --> auto
    Parameter: uvm_channel_num_gpfifo_entries --> 1024
    Parameter: uvm_channel_pushbuffer_loc --> auto
    Parameter: uvm_debug_enable_push_desc --> 0
    Parameter: uvm_debug_prints --> 0
    Parameter: uvm_driver_mode --> 8
    Parameter: uvm_enable_builtin_tests --> 0
    Parameter: uvm_enable_debug_procfs --> 0
    Parameter: uvm_fault_force_sysmem --> 0
    Parameter: uvm_force_prefetch_fault_support --> 0
    Parameter: uvm_global_oversubscription --> 1
    Parameter: uvm_hmm --> 0
    Parameter: uvm_leak_checker --> 0
    Parameter: uvm_page_table_location --> (null)
    Parameter: uvm_perf_access_counter_batch_count --> 256
    Parameter: uvm_perf_access_counter_granularity --> 2m
    Parameter: uvm_perf_access_counter_mimc_migration_enable --> -1
    Parameter: uvm_perf_access_counter_momc_migration_enable --> -1
    Parameter: uvm_perf_access_counter_threshold --> 256
    Parameter: uvm_perf_fault_batch_count --> 256
    Parameter: uvm_perf_fault_coalesce --> 1
    Parameter: uvm_perf_fault_max_batches_per_service --> 20
    Parameter: uvm_perf_fault_max_throttle_per_service --> 5
    Parameter: uvm_perf_fault_replay_policy --> 2
    Parameter: uvm_perf_fault_replay_update_put_ratio --> 50
    Parameter: uvm_perf_map_remote_on_eviction --> 1
    Parameter: uvm_perf_map_remote_on_native_atomics_fault --> 0
    Parameter: uvm_perf_migrate_cpu_preunmap_block_order --> 2
    Parameter: uvm_perf_migrate_cpu_preunmap_enable --> 1
    Parameter: uvm_perf_prefetch_enable --> 1
    Parameter: uvm_perf_prefetch_min_faults --> 1
    Parameter: uvm_perf_prefetch_threshold --> 51
    Parameter: uvm_perf_reenable_prefetch_faults_lapse_msec --> 1000
    Parameter: uvm_perf_thrashing_enable --> 1
    Parameter: uvm_perf_thrashing_epoch_msec --> 1000
    Parameter: uvm_perf_thrashing_lapse_usec --> 250
    Parameter: uvm_perf_thrashing_max_resets --> 4
    Parameter: uvm_perf_thrashing_nap_usec --> 500
    Parameter: uvm_perf_thrashing_pin_msec --> 150
    Parameter: uvm_perf_thrashing_pin_threshold --> 10
    Parameter: uvm_perf_thrashing_threshold --> 3
    
    18.11.2018 01:44 pc2005 | skóre: 38 | blog: GardenOfEdenConfiguration | liberec
    Rozbalit Rozbalit vše Re: Změna IRQ pro komponentu
    Nov 17 21:40:45 PC /usr/lib/gdm3/gdm-x-session[1427]: (EE) NVIDIA(0): The NVIDIA X driver has encountered an error; attempting to
    Nov 17 21:40:45 PC /usr/lib/gdm3/gdm-x-session[1427]: (EE) NVIDIA(0):     recover...
    
    Jakej je výpis /var/log/Xorg* ? To vypadá na nějakej problém s driverama.

    Jinak
    PCI-MSI 524288-edge      nvidia
    takže to teďka jede na MSI.
    21.11.2018 19:50 Ariczek | skóre: 5
    Rozbalit Rozbalit vše Re: Změna IRQ pro komponentu
    Aktuální freeze:
    Nov 21 19:33:48 PC /usr/lib/gdm3/gdm-x-session[1380]: (EE) NVIDIA(0): The NVIDIA X driver has encountered an error; attempting to
    Nov 21 19:33:48 PC /usr/lib/gdm3/gdm-x-session[1380]: (EE) NVIDIA(0):     recover...
    Nov 21 19:33:52 PC kernel: [  692.224052] NVRM: Xid (PCI:0000:01:00): 8, Channel 00000018
    Nov 21 19:33:52 PC kernel: [  694.223908] NVRM: os_schedule: Attempted to yield the CPU while in atomic or interrupt context
    Nov 21 19:33:52 PC kernel: [  696.223835] NVRM: os_schedule: Attempted to yield the CPU while in atomic or interrupt context
    Nov 21 19:33:52 PC /usr/lib/gdm3/gdm-x-session[1380]: (II) event5  - Logitech M705: SYN_DROPPED event - some input events have been lost.
    Nov 21 19:33:58 PC kernel: [  702.399786] NVRM: Xid (PCI:0000:01:00): 16, Head 00000000 Count 00010cf6
    Nov 21 19:34:04 PC kernel: [  704.447886] NVRM: Xid (PCI:0000:01:00): 8, Channel 0000001a
    Nov 21 19:34:04 PC kernel: [  706.447743] NVRM: os_schedule: Attempted to yield the CPU while in atomic or interrupt context
    Nov 21 19:34:04 PC kernel: [  708.447799] NVRM: os_schedule: Attempted to yield the CPU while in atomic or interrupt context
    Nov 21 19:34:16 PC kernel: [  716.735776] NVRM: Xid (PCI:0000:01:00): 8, Channel 0000001a
    Nov 21 19:34:16 PC kernel: [  718.735646] NVRM: os_schedule: Attempted to yield the CPU while in atomic or interrupt context
    Nov 21 19:34:16 PC kernel: [  720.735612] NVRM: os_schedule: Attempted to yield the CPU while in atomic or interrupt context
    Nov 21 19:34:28 PC kernel: [  729.023679] NVRM: Xid (PCI:0000:01:00): 8, Channel 0000001a
    Nov 21 19:34:28 PC kernel: [  731.023494] NVRM: os_schedule: Attempted to yield the CPU while in atomic or interrupt context
    Nov 21 19:34:28 PC kernel: [  733.023468] NVRM: os_schedule: Attempted to yield the CPU while in atomic or interrupt context
    Nov 21 19:34:37 PC kernel: [  741.311635] NVRM: Xid (PCI:0000:01:00): 8, Channel 0000001a
    Nov 21 19:34:39 PC kernel: [  743.311379] NVRM: os_schedule: Attempted to yield the CPU while in atomic or interrupt context
    Nov 21 19:34:41 PC kernel: [  745.311357] NVRM: os_schedule: Attempted to yield the CPU while in atomic or interrupt context
    Nov 21 19:34:49 PC kernel: [  753.599428] NVRM: Xid (PCI:0000:01:00): 8, Channel 0000001a
    Nov 21 19:34:51 PC kernel: [  755.599128] NVRM: os_schedule: Attempted to yield the CPU while in atomic or interrupt context
    Nov 21 19:34:53 PC kernel: [  757.599112] NVRM: os_schedule: Attempted to yield the CPU while in atomic or interrupt context
    Nov 21 19:35:05 PC kernel: [  765.887218] NVRM: Xid (PCI:0000:01:00): 8, Channel 0000001a
    Nov 21 19:35:05 PC kernel: [  767.886972] NVRM: os_schedule: Attempted to yield the CPU while in atomic or interrupt context
    Nov 21 19:35:05 PC kernel: [  769.886878] NVRM: os_schedule: Attempted to yield the CPU while in atomic or interrupt context
    Nov 21 19:35:14 PC kernel: [  778.174900] NVRM: Xid (PCI:0000:01:00): 8, Channel 0000001a
    Nov 21 19:35:16 PC kernel: [  780.174692] NVRM: os_schedule: Attempted to yield the CPU while in atomic or interrupt context
    Nov 21 19:35:18 PC kernel: [  782.174656] NVRM: os_schedule: Attempted to yield the CPU while in atomic or interrupt context
    Nov 21 19:35:26 PC /usr/lib/gdm3/gdm-x-session[1380]: (EE) NVIDIA(0): Error recovery failed.
    Nov 21 19:35:26 PC /usr/lib/gdm3/gdm-x-session[1380]: (EE) NVIDIA(0):  *** Aborting ***
    Nov 21 19:35:26 PC /usr/lib/gdm3/gdm-x-session[1380]: (EE)
    Nov 21 19:35:26 PC /usr/lib/gdm3/gdm-x-session[1380]: Fatal server error:
    Nov 21 19:35:26 PC /usr/lib/gdm3/gdm-x-session[1380]: (EE) Failed to recover from error!
    Nov 21 19:35:26 PC /usr/lib/gdm3/gdm-x-session[1380]: (EE)
    Nov 21 19:35:26 PC /usr/lib/gdm3/gdm-x-session[1380]: (EE)
    Nov 21 19:35:26 PC /usr/lib/gdm3/gdm-x-session[1380]: Please consult the The X.Org Foundation support
    Nov 21 19:35:26 PC /usr/lib/gdm3/gdm-x-session[1380]: #011 at http://wiki.x.org
    Nov 21 19:35:26 PC /usr/lib/gdm3/gdm-x-session[1380]:  for help.
    Nov 21 19:35:26 PC /usr/lib/gdm3/gdm-x-session[1380]: (EE) Please also check the log file at "/var/log/Xorg.1.log" for additional information.
    Nov 21 19:35:26 PC /usr/lib/gdm3/gdm-x-session[1380]: (EE)
    Nov 21 19:35:29 PC /usr/lib/gdm3/gdm-x-session[1380]: (EE) NVIDIA(GPU-0): WAIT (2, 8, 0x8000, 0x0000141c, 0x000014e4)
    Nov 21 19:35:30 PC kernel: [  790.462696] NVRM: Xid (PCI:0000:01:00): 8, Channel 0000001a
    Nov 21 19:35:30 PC kernel: [  792.462450] NVRM: os_schedule: Attempted to yield the CPU while in atomic or interrupt context
    Nov 21 19:35:30 PC kernel: [  794.462387] NVRM: os_schedule: Attempted to yield the CPU while in atomic or interrupt context
    Nov 21 19:35:36 PC /usr/lib/gdm3/gdm-x-session[1380]: (EE) NVIDIA(GPU-0): WAIT (1, 8, 0x8000, 0x0000141c, 0x000014e4)
    Nov 21 19:35:39 PC kernel: [  803.480330] nvidia-modeset: WARNING: GPU:0: Lost display notification (0:0x00000000); continuing.
    Nov 21 19:35:41 PC kernel: [  805.490035] nvidia-modeset: ERROR: GPU:0: Idling display engine timed out: 0x0000987d:0:0
    Nov 21 19:35:43 PC kernel: [  807.490002] nvidia-modeset: ERROR: GPU:0: Idling display engine timed out: 0x0000917e:0:0
    Nov 21 19:35:45 PC kernel: [  809.493258] nvidia-modeset: ERROR: GPU:0: Idling display engine timed out: 0x0000987d:0:0
    Nov 21 19:35:47 PC kernel: [  811.493263] nvidia-modeset: ERROR: GPU:0: Idling display engine timed out: 0x0000917e:0:0
    Nov 21 19:35:50 PC /usr/lib/gdm3/gdm-x-session[1380]: (WW) NVIDIA(0): WAIT (2-S, 17, 0x019a, 0x0000141c, 0x00001588)
    Jediná část podobná tomu nahoře s EE je v souboru /var/log/Xorg.1.log:
    [   692.508] (EE) NVIDIA(0): The NVIDIA X driver has encountered an error; attempting to
    [   692.508] (EE) NVIDIA(0):     recover...
    [   696.509] (II) event5  - Logitech M705: SYN_DROPPED event - some input events have been lost.
    [   790.748] (EE) NVIDIA(0): Error recovery failed.
    [   790.748] (EE) NVIDIA(0):  *** Aborting ***
    [   790.748] (EE) 
    Fatal server error:
    [   790.748] (EE) Failed to recover from error!
    [   790.748] (EE) 
    [   790.748] (EE) 
    Please consult the The X.Org Foundation support 
             at http://wiki.x.org
     for help. 
    [   790.748] (EE) Please also check the log file at "/var/log/Xorg.1.log" for additional information.
    [   790.748] (EE) 
    [   793.748] (EE) NVIDIA(GPU-0): WAIT (2, 8, 0x8000, 0x0000141c, 0x000014e4)
    [   800.748] (EE) NVIDIA(GPU-0): WAIT (1, 8, 0x8000, 0x0000141c, 0x000014e4)
    [   814.781] (WW) NVIDIA(0): WAIT (2-S, 17, 0x019a, 0x0000141c, 0x00001588)
    21.11.2018 23:12 pc2005 | skóre: 38 | blog: GardenOfEdenConfiguration | liberec
    Rozbalit Rozbalit vše Re: Změna IRQ pro komponentu
    The NVIDIA X driver has encountered an error; attempting to
    Problém je, že chyba nastala před touhle hláškou a všechny výpisy, co jsi poslal jsou, až v době kdy se systém snaží tu chybu opravit. Ideální by bylo posílat kompletní logy, ne jen kousky.

    Nemáš doufám v systému nainstalovaný nouveau (opensource) driver (nebo jeho zbytky), že ne?

    Jinak mě už nic jinýho s těmito informacemi nenapadá. Jedině poškozený HW.

    22.11.2018 08:37 dustin | skóre: 63 | blog: dustin
    Rozbalit Rozbalit vše Re: Změna IRQ pro komponentu
    Nestudoval jsem detaily, ale poškozený HW bych také nevyloučil.

    Mám také záhadné problémy s GTX1060. Její PCI-ID chybělo v nejnovějším linuxovém driveru od nvidie, musel jsem downgradovat. OK, to bych bral jako chybu nvidie, i když nechápu...

    Ve windows ji nejnovější nvidií driver vůbec nepozná, windows zahlásí, že je s ní nějaký problém, klasická chyba 43 (např. https://appuals.com/fix-nvidia-code-43-windows-stopped-device-reported-problems/). Starší verze win driveru OK (jenže v té zase synovi padají některé hry, klasika...).

    Takže se dovedu představit, že se třeba zašvihne driver při komunikaci s kartou a vezme s sebou celé jádro...
    22.11.2018 10:24 Ariczek | skóre: 5
    Rozbalit Rozbalit vše Re: Změna IRQ pro komponentu
    Jak píšu v originálním dotazu,
    řeším problém se zamrzáním PC, který nevím, zda je SW nebo HW.
    Co jsem asi zapomněl napsat, kartu jsem po té, co s ní mají nezávisle problémy 2 různé PC, poslal na reklamaci. Vyjádření autorizovaného servisu za czc.cz bylo, že Neuznáno. Uvedená závada se během testování neprojevily. Vráceno zpět bez opravy.

    Tak jsem se pak začal hloubat v SW.
    22.11.2018 10:33 dustin | skóre: 63 | blog: dustin
    Rozbalit Rozbalit vše Re: Změna IRQ pro komponentu
    Klasika, to je přesně důvod, proč většinou kupuju jeté věci. Záruka bývá obvykle k ničemu...
    25.11.2018 18:55 Ariczek | skóre: 5
    Rozbalit Rozbalit vše Re: Změna IRQ pro komponentu
    Příloha:
    Ok, dávám do přílohy celý syslog, chyba nastala dnes v 17:44.

    Ad nouveau: Snažil jsem se případné pohrobky zabít:
    /etc/modprobe.d$ cat blacklist-nvidia-nouveau.conf
    blacklist nouveau
    options nouveau modeset=0
    
    25.11.2018 22:34 pc2005 | skóre: 38 | blog: GardenOfEdenConfiguration | liberec
    Rozbalit Rozbalit vše Re: Změna IRQ pro komponentu
    (II) LoadModule: "nouveau"
    Ještě že jsem ze zeptal :-P.

    Od nouveau budou tři části kernel modul a xorg driver pro komunikaci s kernelem a mesa GL. Nvidia proprietární potřebuje aby v systému nebyl ani jeden, doinstaluje si vlastní. Asi by šlo nějak nastavit aby se ignoroval xorg driver a kernel modul by mělo stačit blacklistovat, ale ta mesa bude vždycky komplikovaná. Snad jsem slyšel o nějakým wrapperu okolo mesy a priprietární implementace opengl, ubuntoidy neznám podrobně, ale na slackwaru mě instalace proprietárního driveru vždycky rozbila knihovny, takže jsem je musel mazat a opravovat manuálně.

    Nouveau prostě dostat ze systému kompletně. Jak je vidět, z Xorg.conf:
    Nov 25 17:42:33 PC /usr/lib/gdm3/gdm-x-session[1132]: (II) LoadModule: "nvidia"
    ...
    Nov 25 17:42:33 PC /usr/lib/gdm3/gdm-x-session[1132]: (II) LoadModule: "nouveau"
    
    Tak to najednou načte oba drivery a bůhví co to udělá se systémem.

    options nouveau modeset=0
    Tohle je naprosto zbytečný, pokud je blacklistovanej. Ale lepší kdyby nebyl v systému vůbec.
    AIGLX: reverting to software rendering
    Tahle hláška vznikla kdy? Hláška znamená, že ti nejede vůbec 3D akcelerace. Ale je zajímavý, že není při každém spuštění xek.
    == Stack trace for context 0x55e47389c320 ==
    Ten system je dobře rozkopanej o_O. Nebo to byl polomrtvý systém po driverů na grafiku?

    25.11.2018 22:50 pc2005 | skóre: 38 | blog: GardenOfEdenConfiguration | liberec
    Rozbalit Rozbalit vše Re: Změna IRQ pro komponentu
    Jo aha tys mezitím to nouveau vyhodil?

    Ještě můžeš ověřit zda, když odinstaluješ proprietární driver, tak zda /usr/lib/x86_64-linux-gnu/nvidia/xorg/libglx.so a vlastně celej adresář zmizí (použij ssh, protože nebudeš mít video :-D). A zda po odinstalování stále existuje v systému nějaká knihovna s *glx* v názvu.
    Matched nouveau as autoconfigured driver
    Pořád tam máš

    Koukám ještě se tam snaží načíst vesa a fb, ale to by snad nemělo vadit, ty jsou dost high level, že by neměly proprietární driver s neznámým kódem rozhodit (i když teda poslední proprietární driver pro geforce2MX taky neuměl framebuffer - ale to už je skoro 7 let co jsem ho používal).
    26.11.2018 08:45 Ariczek | skóre: 5
    Rozbalit Rozbalit vše Re: Změna IRQ pro komponentu
    No, většinou to vypadá tak, že hodím něco ve smyslu:
    apt install nvidia-driver-415
    Když to doběhne, tak udělám reboot. Pak testuju se zamrzáním.

    A pak se zase dostanu do konzole, udělám
    apt remove nvidia-driver-415
    a
    apt autoremove
    a opět reboot.

    A tím se dostanu do stavu, kdy je systém použitelný dlouhodobě, ale 3D grafika nefunguje...

    To byl ten důvod, proč jsem osekával syslogy, protože po většinu času OS nějak funguje (nezamrzá) ale čert ví co mám v tu chvíli běžícího.
    26.11.2018 22:59 pc2005 | skóre: 38 | blog: GardenOfEdenConfiguration | liberec
    Rozbalit Rozbalit vše Re: Změna IRQ pro komponentu
    apt remove nvidia-driver-415
    Nenainstaluje se při tom nouveau jako náhrada?

    BTW odkud máš driver 415? Podle obou syslog výpisů máš ubuntu 18.04 (bionic?) a tam je nejnovější 390. Dokonce i v ubuntu disco je nejnovější verze pouze 410.

    Jestli jsi zkoušel různé verze a do toho ještě balíky přímo od nvidie, tak sis mohl dost zaneřádit systém. Třeba jenom tím, že někdo v těch verzích zapomněl updatovat nějakej konfigurák apod. Můžeš zkusit
    apt purge
    na ty daný balíky. Osobně bych ale zkusil čistou reinstalaci (třeba na to nejnovější ubuntu "disco"). Balíky přímo od nvidie jenom jako poslední možnost s tím, že nemusí být kompatibilní se zbytkem systému (je důvod proč má ubuntu přímo vlastní balíček).
    To byl ten důvod, proč jsem osekával syslogy, protože po většinu času OS nějak funguje (nezamrzá) ale čert ví co mám v tu chvíli běžícího.
    Připravuješ nás tím ale o důležité informace jako je verze OS, verze driverů, hlášení Xorg.log apod. Ono třeba i tohle (z logu odtud):
    Nov 25 19:01:30 PC systemd[1]: Stopped NVIDIA Persistence Daemon.
    Nov 25 19:01:30 PC systemd[1]: Starting NVIDIA Persistence Daemon...
    Nov 25 19:01:30 PC systemd[1]: Started NVIDIA Persistence Daemon.
    Nov 25 19:01:30 PC systemd[1]: Stopping NVIDIA Persistence Daemon...
    Nov 25 19:01:30 PC systemd[1]: Stopped NVIDIA Persistence Daemon.
    Nov 25 19:01:30 PC systemd[1]: Starting NVIDIA Persistence Daemon...
    
    Není něco co vypadá normálně (několikrát za sekundu se zapne a vypne).

    Pokud se vydáš cestou ruční kontroly, tak odinstaluj všechno co souvisí s nvidia grafikou a ručně si ověř zda v systému opravdu nezbyly žádné soubory. Pro nvidia 390 v bionicu například seznam zde, ale pozor rozhodně to není komplet seznam (a můžeš mít jiné verze), musel bys proklikat všechny závislé balíky odsud. Dále v systému nesmí být soubor s "nouveau" v názvu a v /etc nesmí být zmínka o nouveau (kromě konfiguráku pro blacklist) dale bych hledal knihovny, které mají v sobě string libgl/libGL, libegl/libEGL apod (pozor může to být i jen shoda jmen, vždycky se koukni ke kterému balíčku to patří).
    25.11.2018 00:28 gogol
    Rozbalit Rozbalit vše Re: Změna IRQ pro komponentu
    V súčasnosti to síce nieje už moc aktuálne, ale v dobách keď sme bojovali s malým počtom IRQ liniek sa písali ovládače tak, že hw zvládal beať na aj zdielanom IRQ. Všetko sa zmenilo príchodom I/O APIC a multiprocessingu. Problém s IRQ bude v súčasnosti dosť ojedinelý a ja osobne som naňho narazil akurát u archaického hardware a u ovládača, ktorý je ktomu hw písaný pred 10 rokmi, ale ani u neho jadro nespadne, len zahlási problém s IRQ. Jadro je možné ovšem zostreliť veľmi jednoducho ak je v ovládači matematická chyba delenia nulou a trocha ťažšie a nepredvítateľne ak je pri multi processingu chybne ošetrená synchronizácia kontextu. Inak povedané ak je chyba v ovládači, tak si s týmto ovládačom asi nepomôžeš.
    25.11.2018 09:15 Peter Golis | skóre: 64 | blog: Bežné záležitosti | Bratislava
    Rozbalit Rozbalit vše Re: Změna IRQ pro komponentu
    Chcel by som si pozrieť ako by si dokázal zdieľať v tých časoch jedno prerušenie pre napríklad 3d grafickú kartu a hw raid radič.
    25.11.2018 01:43 theseuszn
    Rozbalit Rozbalit vše Re: Změna IRQ pro komponentu
    Zkus ty drivery odebrat, očistit os a nasadit v.390.87. Já sice "Ti" nemám, mám jen obyč 1050-tku, ale ostatní drivery mi taky blbly, sice ne až tak, jak popisuješ, ale blbly. Ve verzi 390.87 mám klid
    25.11.2018 20:31 Ariczek | skóre: 5
    Rozbalit Rozbalit vše Re: Změna IRQ pro komponentu
    Příloha:
    Obávám, že ani verze 390 nefunguje tak jak má na mém pc.

    Přikládám logy, k zamrznutí došlo někdy 19:19.

    Založit nové vláknoNahoru

    Tiskni Sdílej: Linkuj Jaggni to Vybrali.sme.sk Google Del.icio.us Facebook

    ISSN 1214-1267   www.czech-server.cz
    © 1999-2015 Nitemedia s. r. o. Všechna práva vyhrazena.