abclinuxu.cz AbcLinuxu.cz itbiz.cz ITBiz.cz HDmag.cz HDmag.cz abcprace.cz AbcPráce.cz
AbcLinuxu hledá autory!
Inzerujte na AbcPráce.cz od 950 Kč
Rozšířené hledání
×
    dnes 14:00 | Komunita

    Sovereign Tech Agency (Wikipedie) prostřednictvím svého fondu Sovereign Tech Fund podpoří KDE částkou 1 285 200 eur.

    Ladislav Hagara | Komentářů: 0
    dnes 12:55 | IT novinky

    Google na včerejší akci The Android Show | I/O Edition 2026 (YouTube) představil celou řadu novinek: Gemini Intelligence, notebooky Googlebook, novou generaci Android Auto, …

    Ladislav Hagara | Komentářů: 0
    dnes 12:33 | IT novinky

    Evropská komise by do léta mohla předložit návrh normy omezující používání sociálních sítí dětmi v zájmu jejich bezpečí na internetu. Prohlásila to včera předsedkyně EK Ursula von der Leyenová, podle níž řada zemí Evropské unie volá po zavedení věkové hranice pro sociální sítě. EU částečně řeší bezpečnost dětí v digitálním prostředí v již platném nařízení o digitálních službách (DSA), podle německé političky to však není dostatečné a

    … více »
    Ladislav Hagara | Komentářů: 9
    dnes 04:11 | Nová verze

    Multiplatformní open source aplikace scrcpy (Wikipedie) pro zrcadlení připojeného zařízení se systémem Android na desktopu a umožňující ovládání tohoto zařízení z desktopu, byla vydána v nové verzi 4.0.

    Ladislav Hagara | Komentářů: 0
    včera 23:22 | Pozvánky

    Chybí vám někdo, s kým byste si popovídali o bastlení, technice, počítačích a vědě? Nechcete riskovat debatu o sportu u piva v hospodě? Pak doražte na virtuální pokec u virtuálního piva v rámci Virtuální Bastlírny organizované strahovským MacGyverem již tento čtvrtek. Možná se ptáte, co se tak může probírat? Dají se probrat slavná výročí - kromě 55 let obvodu 555 (což je mimochodem prý andělské číslo) a vzpomínky na firmu Signetics -

    … více »
    bkralik | Komentářů: 0
    včera 23:11 | Zajímavý software

    GTK2-NG je komunitní fork GTK 2.24 (aktuální verze je 4.22). Oznámení a diskuse v diskusním fóru Devuanu, forku Debianu bez systemd. Není to jediný fork GTK 2. Ardour je například postaven na vlastním forku GTK 2 s názvem YTK.

    Ladislav Hagara | Komentářů: 0
    včera 17:33 | Pozvánky

    V neděli 17. května 2026 proběhne v Českých Budějovicích první MobileLinux Hackday zaměřený na Linux v mobilech, embedded platformy a open source hardware. Po sedmi úspěšných měsíčních setkáních v Praze se akce přesouvá také do jižních Čech, aby se komunita mobilního Linuxu mohla potkat i mimo hlavní město. Akce se uskuteční v konferenčním sále Vajgar v Clarion Congress Hotelu (Pražská tř. 2306/14) se zahájením mezi 14:00 až 15:00 a … více »

    lkocman | Komentářů: 0
    včera 15:00 | Komunita

    Vývojáři Debianu zhruba v polovině vývojového cyklu Debianu 14 s kódovým názvem Forky rozhodli, že Debian musí dodávat reprodukovatelné balíčky, tj. kdokoli si může nezávisle ověřit, že daný binární balíček vznikl překladem a sestavením z konkrétních zdrojových kódů. Aktuálně je reprodukovatelných 98,29 % balíčků.

    Ladislav Hagara | Komentářů: 0
    včera 14:11 | Bezpečnostní upozornění

    Německý e-shop Škoda Auto byl hacknut. Útočníci získali přístup k uživatelským údajům (jméno, adresa, e-mail, heslo, telefon, …).

    Ladislav Hagara | Komentářů: 5
    včera 11:22 | Pozvánky

    Na webu konference Den IPv6 2026, která se uskuteční 4. června v Národní technické knihovně v pražských Dejvicích, je nyní k dispozici kompletní program této tradiční akce věnované tématům spojeným s protokolem IPv6. Na celodenní pásmo přednášek je třeba se přihlásit a zaplatit účastnický poplatek 242 korun. Registrační formulář najdou zájemci opět na webu akce. Konferenci Den IPv6 2026 organizují i letos společně sdružení CESNET, CZ.NIC a NIX.CZ.

    VSladek | Komentářů: 2
    Které desktopové prostředí na Linuxu používáte?
     (13%)
     (9%)
     (2%)
     (14%)
     (31%)
     (4%)
     (7%)
     (3%)
     (16%)
     (25%)
    Celkem 1595 hlasů
     Komentářů: 30, poslední 3.4. 20:20
    Rozcestník

    Dotaz: ECC chyby a Dual-channel - který modul je vadný?

    Jendа avatar 10.7.2017 06:41 Jendа | skóre: 78 | blog: Jenda | JO70FB
    ECC chyby a Dual-channel - který modul je vadný?
    Přečteno: 974×
    Ahoj,

    Asus Z10PE-D8 WS s dvěma CPU a 8x16 GB RAM ukazuje následující dvě zprávy:
    mce: [Hardware Error]: Machine check events logged
    EDAC sbridge MC0: HANDLING MCE MEMORY ERROR
    EDAC sbridge MC0: CPU 12: Machine Check Event: 0 Bank 9: 8c000050000800c0
    EDAC sbridge MC0: TSC 0 
    EDAC sbridge MC0: ADDR 1485247000 
    EDAC sbridge MC0: MISC 90000010001208c 
    EDAC sbridge MC0: PROCESSOR 0:306f2 TIME 1497174376 SOCKET 1 APIC 20
    EDAC MC0: 1 CE memory scrubbing error on CPU_SrcID#1_Ha#0_Chan#1_DIMM#0 (channel:1 slot:0 page:0x1485247 offset:0x0 grain:32 syndrome:0x0 -  area:DRAM err_code:0008:00c0 socket:1 ha:0 channel_mask:2 rank:0)
    
    mce: [Hardware Error]: Machine check events logged
    EDAC sbridge MC0: HANDLING MCE MEMORY ERROR
    EDAC sbridge MC0: CPU 12: Machine Check Event: 0 Bank 7: 8c00004000010090
    EDAC sbridge MC0: TSC 0 
    EDAC sbridge MC0: ADDR 1485247540 
    EDAC sbridge MC0: MISC 1527afa86 
    EDAC sbridge MC0: PROCESSOR 0:306f2 TIME 1495475795 SOCKET 1 APIC 20
    EDAC MC0: 1 CE memory read error on CPU_SrcID#1_Ha#0_Chan#0_DIMM#0 (channel:0 slot:0 page:0x1485247 offset:0x540 grain:32 syndrome:0x0 -  area:DRAM err_code:0001:0090 socket:1 ha:0 channel_mask:1 rank:0)
    
    # edac-util -v
    mc0: 0 Uncorrected Errors with no DIMM info
    mc0: 0 Corrected Errors with no DIMM info
    mc0: csrow0: 0 Uncorrected Errors
    mc0: csrow0: CPU_SrcID#1_Ha#0_Chan#0_DIMM#0: 26 Corrected Errors
    mc0: csrow0: CPU_SrcID#1_Ha#0_Chan#1_DIMM#0: 66 Corrected Errors
    mc0: csrow0: CPU_SrcID#1_Ha#1_Chan#0_DIMM#0: 0 Corrected Errors
    mc0: csrow0: CPU_SrcID#1_Ha#1_Chan#1_DIMM#0: 0 Corrected Errors
    mc1: 0 Uncorrected Errors with no DIMM info
    mc1: 0 Corrected Errors with no DIMM info
    mc1: csrow0: 0 Uncorrected Errors
    mc1: csrow0: CPU_SrcID#0_Ha#0_Chan#0_DIMM#0: 0 Corrected Errors
    mc1: csrow0: CPU_SrcID#0_Ha#0_Chan#1_DIMM#0: 0 Corrected Errors
    mc1: csrow0: CPU_SrcID#0_Ha#1_Chan#0_DIMM#0: 0 Corrected Errors
    mc1: csrow0: CPU_SrcID#0_Ha#1_Chan#1_DIMM#0: 0 Corrected Errors
    
    Přečetl jsem si adresu, na kterou to nadává (0x1485247XXX), a v dmidecode našel následující:
    Handle 0x006F, DMI type 16, 23 bytes
    Physical Memory Array
            Location: System Board Or Motherboard
            Use: System Memory
            Error Correction Type: Multi-bit ECC
            Maximum Capacity: 128 GB
            Error Information Handle: Not Provided
            Number Of Devices: 2
    
    Handle 0x0070, DMI type 19, 31 bytes
    Memory Array Mapped Address
            Starting Address: 0x01000000000
            Ending Address: 0x017FFFFFFFF
            Range Size: 32 GB
            Physical Array Handle: 0x006F
            Partition Width: 2
    
    Handle 0x0071, DMI type 17, 34 bytes
    Memory Device
            Array Handle: 0x006F
            Error Information Handle: Not Provided
            Total Width: 72 bits
            Data Width: 64 bits
            Size: 16384 MB
            Form Factor: DIMM
            Set: None
            Locator: DIMM_E1
            Bank Locator: NODE 3
            Type: Other
            Type Detail: Synchronous
            Speed: 2133 MHz
            Manufacturer: Micron
            Serial Number: 112718E3
            Asset Tag: DIMM_E1_AssetTag
            Part Number: 36ASF2G72PZ-2G1A2  
            Rank: 2
            Configured Clock Speed: 2133 MHz
    
    Handle 0x0072, DMI type 20, 35 bytes
    Memory Device Mapped Address
            Starting Address: 0x01000000000
            Ending Address: 0x013FFFFFFFF
            Range Size: 16 GB
            Physical Device Handle: 0x0071
            Memory Array Mapped Address Handle: 0x0070
            Partition Row Position: 1
    
    Handle 0x0073, DMI type 17, 34 bytes
    Memory Device
            Array Handle: 0x006F
            Error Information Handle: Not Provided
            Total Width: 72 bits
            Data Width: 64 bits
            Size: 16384 MB
            Form Factor: DIMM
            Set: None
            Locator: DIMM_F1
            Bank Locator: NODE 3
            Type: Other
            Type Detail: Synchronous
            Speed: 2133 MHz
            Manufacturer: Micron
            Serial Number: 11271993
            Asset Tag: DIMM_F1_AssetTag
            Part Number: 36ASF2G72PZ-2G1A2  
            Rank: 2
            Configured Clock Speed: 2133 MHz
    
    Handle 0x0074, DMI type 20, 35 bytes
    Memory Device Mapped Address
            Starting Address: 0x01400000000
            Ending Address: 0x017FFFFFFFF
            Range Size: 16 GB
            Physical Device Handle: 0x0073
            Memory Array Mapped Address Handle: 0x0070
            Partition Row Position: 1
    
    Handle 0x0075, DMI type 16, 23 bytes
    Physical Memory Array
            Location: System Board Or Motherboard
            Use: System Memory
            Error Correction Type: Multi-bit ECC
            Maximum Capacity: 128 GB
            Error Information Handle: Not Provided
            Number Of Devices: 2
    
    Sloty na desce jsou fyzicky popsané DIMM_A1 až H1 a adresa, ve které došlo k chybě, spadá do DIMM_F1. Jenže mi není jasné, jak funguje ten dual channel - naivně jsem si myslel, že paměť interleavuje po malých blocích (šířka sběrnice nebo cacheline), jenže v tom dmidecode je vidět, že paměťové moduly jdou po 16 GiB. Není možné, že je chyba třeba i v modulu DIMM_E1?

    Odpovědi

    10.7.2017 18:22 Trubicoid2
    Rozbalit Rozbalit vše Re: ECC chyby a Dual-channel - který modul je vadný?
    Bych tomu dmidecode moc nevěřil. Díky tomu interleave to může být v libovolným dimmu u příslušnýho CPU. Měl jsem zato, že se interleavuje po 64 nebo 128b.

    Nejlepší možnost je postupně dimmy vyndávat, až chyba zmizí, tak to byl on :)
    Jendа avatar 10.7.2017 18:57 Jendа | skóre: 78 | blog: Jenda | JO70FB
    Rozbalit Rozbalit vše Re: ECC chyby a Dual-channel - který modul je vadný?
    Hm, super.

    To má dva problémy: DIMMy jsou blbě dostupné pod chladičem CPU a chyba se objevuje občas.
    10.7.2017 20:42 Trubicoid2
    Rozbalit Rozbalit vše Re: ECC chyby a Dual-channel - který modul je vadný?
    Chladič blbý. Ale třeba jenom tu plastovou packu na jedné straně otevřeš? Bez vytahování modulu.

    Že se chyba objevuje jen občas - tomu by se dalo pomoct. Paměti prohřát. Hodí se třeba pustit několikrát memtester podle počtu jader a dát každěmu o trošičku méně než RAM/jader, aby to těsně ještě neswapovalo.

    Pak by se chyba mohla projevit do hodiny? A můžeš experimentovat s vytahováním modulů. Klidně začni s tím, co ti vyšel podle dmidecode.
    11.7.2017 04:13 pc2005 | skóre: 38 | blog: GardenOfEdenConfiguration | liberec
    Rozbalit Rozbalit vše Re: ECC chyby a Dual-channel - který modul je vadný?
    Hmm tak zrovne můj i945gm čipset má vtipnej dualchannel kde to prokládá adresy jen když mají moduly stejnou kapacitu, jinak je řadí za sebe :-/. Ale to tvůj problém nebude.

    Osobně asi bude mít 100% účinnost to prohazování a testování modulů (pokud je chyba tam).

    Ale mohl by ses podívat do manuálu (našel jsem nějakej procík na základě tvé desky a od té generace datasheet, možná to je špatnej). Ale z těch voleb jako "Channel interleave wayness" mě teda přecházej oči :-D.

    Po zadání do googlu to našlo jednofórum, kde se to prokládání dá konfigurovat v BIOSu. Třeba tvoje deska to umí taky.
    11.7.2017 04:14 pc2005 | skóre: 38 | blog: GardenOfEdenConfiguration | liberec
    Rozbalit Rozbalit vše Re: ECC chyby a Dual-channel - který modul je vadný?
    13.7.2017 11:59 trubicoid2
    Rozbalit Rozbalit vše Re: ECC chyby a Dual-channel - který modul je vadný?
    jsou nejaky novy poznatky?
    Jendа avatar 13.7.2017 17:37 Jendа | skóre: 78 | blog: Jenda | JO70FB
    Rozbalit Rozbalit vše Re: ECC chyby a Dual-channel - který modul je vadný?
    Memtest86+ nic nenašel (vůbec nedetekuje, že mám ECC), memtester ji dokáže vyvolat.

    Vypnul jsem v BIOSu dual channel, dostal jsem jinou adresu směřující do slotu E1, vyndal jsem půlku pamětí (deska podle manuálu umí jenom 2, 4 nebo 8 slotů a já nemám žádný jiný DDR4 modul) a vyměnil modul E1 a chyba do hodiny nebyla (ale je to dost krátké testování), dal jsem do E1 zpátky podezřelý modul a chyba se objevila, ale pak jsem musel odejít.
    13.7.2017 18:02 pc2005 | skóre: 38 | blog: GardenOfEdenConfiguration | liberec
    Rozbalit Rozbalit vše Re: ECC chyby a Dual-channel - který modul je vadný?
    Jo jestli memtest86+ neumí ECC, tak je pro něj ta 1bit oprava transparentní.
    13.7.2017 18:28 trubicoid2
    Rozbalit Rozbalit vše Re: ECC chyby a Dual-channel - který modul je vadný?
    jo, memtester je na zahrati pameti dobrej :) s modulem jc42 jde teplota RAM sledovat pomoci sensors

    vetsina tech ECC chyb je citliva na teplotu

    taky zalezi, jestli je ten vadny modul alokovany a cteny nebo prazdny, vselijake ty setrice energie pak muzou zpusobit, ze se nedela ECC scrub nebo ne tak casto, kdezto cteni vzdy ECC kontrolu vyvola - memtester je na to dobry

    Založit nové vláknoNahoru

    Tiskni Sdílej: Linkuj Jaggni to Vybrali.sme.sk Google Del.icio.us Facebook

    ISSN 1214-1267   www.czech-server.cz
    © 1999-2015 Nitemedia s. r. o. Všechna práva vyhrazena.