abclinuxu.cz AbcLinuxu.cz itbiz.cz ITBiz.cz HDmag.cz HDmag.cz abcprace.cz AbcPráce.cz
AbcLinuxu hledá autory!
Inzerujte na AbcPráce.cz od 950 Kč
Rozšířené hledání
×
    včera 15:33 | IT novinky

    Po 26 letech od protiprávního policejního zásahu, který byl spuštěn na základě podnětu společnosti Microsoft, Obvodní soud pro Prahu 2 rozsudkem potvrdil, že Mironet prokázal významnou část svého nároku na náhradu škody vůči Ministerstvu spravedlnosti ČR. Soudem nyní přiznaná část nároku znamená rekordní odškodné, jaké kdy české soudy přiznaly za nesprávný postup státu. Spor byl rozdělen na několik škod, u pravomocně uzavřených částí

    … více »
    Ladislav Hagara | Komentářů: 18
    včera 15:22 | Nová verze

    Lehké desktopové prostředí LXQt bylo vydáno ve verzi 2.4.0. Jde o převážně opravné vydání s drobnými vylepšeními podpory Waylandu.

    |🇵🇸 | Komentářů: 0
    včera 12:44 | IT novinky

    Počítačová hra Kingdom Come: Deliverance 2 českého studia Warhorse získala cenu BAFTA v kategorii nejlepší příběh. V konkurenci pěti dalších nominovaných děl porazila i úspěšnou francouzskou hru Clair Obscur: Expedition 33, která v letošním ročníku získala cenu za nejlepší hru roku.

    Ladislav Hagara | Komentářů: 1
    včera 12:22 | Komunita

    Projekt KDE oslaví v říjnu 30 let. Matthias Ettrich poslal 14. října 1996 do diskusní skupiny comp.os.linux.misc zprávu, která započala historii projektu. Důležité milníky jsou zobrazeny na časové ose KDE.

    Ladislav Hagara | Komentářů: 2
    včera 02:55 | Komunita

    Byly vyhlášeny výsledky letošní volby vedoucí/ho projektu Debian (DPL, Wikipedie). Poprvé povede Debian žena. Novou vedoucí je Sruthi Chandran. Letos byla jedinou kandidátkou. Kandidovala již v letech 2020, 2021, 2024 a 2025. Na konferenci DebConf19 měla přednášku Is Debian (and Free Software) gender diverse enough?

    Ladislav Hagara | Komentářů: 16
    včera 00:55 | Nová verze

    Byla vydána nová verze 10.3 z Debianu vycházející linuxové distribuce DietPi pro (nejenom) jednodeskové počítače. Přehled novinek v poznámkách k vydání. Přidána byla podpora Orange Pi 4 LTS. Přibyl balíček Prometheus.

    Ladislav Hagara | Komentářů: 0
    19.4. 18:55 | Nová verze

    Implementace VPN softwaru WireGuard (Wikipedie) pro Windows, tj. WireGuard pro Windows a WireGuardNT, dospěly do verze 1.0.

    Ladislav Hagara | Komentářů: 2
    19.4. 16:11 | IT novinky

    V Pekingu dnes proběhl 2. ročník půlmaratonu humanoidních robotů. První 3 místa obsadili roboti Honor Lightning v různých týmech. Nový rekord autonomního robota je 50 minut a 26 sekund. Operátorem řízený robot to zvládl i s pádem za 48 minut a 19 sekund. Řízení roboti měli časovou penalizaci 20 %. Před rokem nejrychlejší robot zvládl půlmaraton za 2 hodiny 40 minut a 42 sekund. Aktuální lidský rekord drží Jacob Kiplimo z Ugandy s časem 57 minut a 20 sekund [𝕏].

    Ladislav Hagara | Komentářů: 6
    17.4. 17:11 | Zajímavý článek

    Stanislav Fort, vedoucí vědecký pracovník z Vlčkovy 'kyberbezpečnostní' firmy AISLE, zkoumal dopady Anthropic Mythos (nový AI model od Anthropicu zaměřený na hledání chyb, který před nedávnem vyplašil celý svět) a předvedl, že schopnosti umělé inteligence nejsou lineárně závislé na velikosti nebo ceně modelu a dokázal, že i některé otevřené modely zvládly v řadě testů odhalit ve zdrojových kódech stejné chyby jako Mythos (například FreeBSD CVE-2026-4747) a to s výrazně nižšími provozními náklady.

    MakeIranBombedAgain❗ | Komentářů: 8
    17.4. 12:44 | IT novinky

    Federální návrh zákona H.R.8250 'Parents Decide Act', 13. dubna předložený demokratem Joshem Gottheimerem a podpořený republikánkou Elise Stefanik coby spolupředkladatelkou (cosponsor), by v případě svého schválení nařizoval všem výrobcům operačních systémů při nastavování zařízení ověřovat věk uživatelů a při používání poskytovat tento věkový údaj aplikacím třetích stran. Hlavní rozdíl oproti kalifornskému zákonu AB 1043 a kolorádskému SB26-051 je ten, že federální návrh by platil rovnou pro celé USA.

    MakeIranBombedAgain❗ | Komentářů: 13
    Které desktopové prostředí na Linuxu používáte?
     (14%)
     (8%)
     (1%)
     (12%)
     (30%)
     (3%)
     (6%)
     (2%)
     (15%)
     (25%)
    Celkem 1370 hlasů
     Komentářů: 30, poslední 3.4. 20:20
    Rozcestník

    Dotaz: ECC chyby a Dual-channel - který modul je vadný?

    Jendа avatar 10.7.2017 06:41 Jendа | skóre: 78 | blog: Jenda | JO70FB
    ECC chyby a Dual-channel - který modul je vadný?
    Přečteno: 969×
    Ahoj,

    Asus Z10PE-D8 WS s dvěma CPU a 8x16 GB RAM ukazuje následující dvě zprávy:
    mce: [Hardware Error]: Machine check events logged
    EDAC sbridge MC0: HANDLING MCE MEMORY ERROR
    EDAC sbridge MC0: CPU 12: Machine Check Event: 0 Bank 9: 8c000050000800c0
    EDAC sbridge MC0: TSC 0 
    EDAC sbridge MC0: ADDR 1485247000 
    EDAC sbridge MC0: MISC 90000010001208c 
    EDAC sbridge MC0: PROCESSOR 0:306f2 TIME 1497174376 SOCKET 1 APIC 20
    EDAC MC0: 1 CE memory scrubbing error on CPU_SrcID#1_Ha#0_Chan#1_DIMM#0 (channel:1 slot:0 page:0x1485247 offset:0x0 grain:32 syndrome:0x0 -  area:DRAM err_code:0008:00c0 socket:1 ha:0 channel_mask:2 rank:0)
    
    mce: [Hardware Error]: Machine check events logged
    EDAC sbridge MC0: HANDLING MCE MEMORY ERROR
    EDAC sbridge MC0: CPU 12: Machine Check Event: 0 Bank 7: 8c00004000010090
    EDAC sbridge MC0: TSC 0 
    EDAC sbridge MC0: ADDR 1485247540 
    EDAC sbridge MC0: MISC 1527afa86 
    EDAC sbridge MC0: PROCESSOR 0:306f2 TIME 1495475795 SOCKET 1 APIC 20
    EDAC MC0: 1 CE memory read error on CPU_SrcID#1_Ha#0_Chan#0_DIMM#0 (channel:0 slot:0 page:0x1485247 offset:0x540 grain:32 syndrome:0x0 -  area:DRAM err_code:0001:0090 socket:1 ha:0 channel_mask:1 rank:0)
    
    # edac-util -v
    mc0: 0 Uncorrected Errors with no DIMM info
    mc0: 0 Corrected Errors with no DIMM info
    mc0: csrow0: 0 Uncorrected Errors
    mc0: csrow0: CPU_SrcID#1_Ha#0_Chan#0_DIMM#0: 26 Corrected Errors
    mc0: csrow0: CPU_SrcID#1_Ha#0_Chan#1_DIMM#0: 66 Corrected Errors
    mc0: csrow0: CPU_SrcID#1_Ha#1_Chan#0_DIMM#0: 0 Corrected Errors
    mc0: csrow0: CPU_SrcID#1_Ha#1_Chan#1_DIMM#0: 0 Corrected Errors
    mc1: 0 Uncorrected Errors with no DIMM info
    mc1: 0 Corrected Errors with no DIMM info
    mc1: csrow0: 0 Uncorrected Errors
    mc1: csrow0: CPU_SrcID#0_Ha#0_Chan#0_DIMM#0: 0 Corrected Errors
    mc1: csrow0: CPU_SrcID#0_Ha#0_Chan#1_DIMM#0: 0 Corrected Errors
    mc1: csrow0: CPU_SrcID#0_Ha#1_Chan#0_DIMM#0: 0 Corrected Errors
    mc1: csrow0: CPU_SrcID#0_Ha#1_Chan#1_DIMM#0: 0 Corrected Errors
    
    Přečetl jsem si adresu, na kterou to nadává (0x1485247XXX), a v dmidecode našel následující:
    Handle 0x006F, DMI type 16, 23 bytes
    Physical Memory Array
            Location: System Board Or Motherboard
            Use: System Memory
            Error Correction Type: Multi-bit ECC
            Maximum Capacity: 128 GB
            Error Information Handle: Not Provided
            Number Of Devices: 2
    
    Handle 0x0070, DMI type 19, 31 bytes
    Memory Array Mapped Address
            Starting Address: 0x01000000000
            Ending Address: 0x017FFFFFFFF
            Range Size: 32 GB
            Physical Array Handle: 0x006F
            Partition Width: 2
    
    Handle 0x0071, DMI type 17, 34 bytes
    Memory Device
            Array Handle: 0x006F
            Error Information Handle: Not Provided
            Total Width: 72 bits
            Data Width: 64 bits
            Size: 16384 MB
            Form Factor: DIMM
            Set: None
            Locator: DIMM_E1
            Bank Locator: NODE 3
            Type: Other
            Type Detail: Synchronous
            Speed: 2133 MHz
            Manufacturer: Micron
            Serial Number: 112718E3
            Asset Tag: DIMM_E1_AssetTag
            Part Number: 36ASF2G72PZ-2G1A2  
            Rank: 2
            Configured Clock Speed: 2133 MHz
    
    Handle 0x0072, DMI type 20, 35 bytes
    Memory Device Mapped Address
            Starting Address: 0x01000000000
            Ending Address: 0x013FFFFFFFF
            Range Size: 16 GB
            Physical Device Handle: 0x0071
            Memory Array Mapped Address Handle: 0x0070
            Partition Row Position: 1
    
    Handle 0x0073, DMI type 17, 34 bytes
    Memory Device
            Array Handle: 0x006F
            Error Information Handle: Not Provided
            Total Width: 72 bits
            Data Width: 64 bits
            Size: 16384 MB
            Form Factor: DIMM
            Set: None
            Locator: DIMM_F1
            Bank Locator: NODE 3
            Type: Other
            Type Detail: Synchronous
            Speed: 2133 MHz
            Manufacturer: Micron
            Serial Number: 11271993
            Asset Tag: DIMM_F1_AssetTag
            Part Number: 36ASF2G72PZ-2G1A2  
            Rank: 2
            Configured Clock Speed: 2133 MHz
    
    Handle 0x0074, DMI type 20, 35 bytes
    Memory Device Mapped Address
            Starting Address: 0x01400000000
            Ending Address: 0x017FFFFFFFF
            Range Size: 16 GB
            Physical Device Handle: 0x0073
            Memory Array Mapped Address Handle: 0x0070
            Partition Row Position: 1
    
    Handle 0x0075, DMI type 16, 23 bytes
    Physical Memory Array
            Location: System Board Or Motherboard
            Use: System Memory
            Error Correction Type: Multi-bit ECC
            Maximum Capacity: 128 GB
            Error Information Handle: Not Provided
            Number Of Devices: 2
    
    Sloty na desce jsou fyzicky popsané DIMM_A1 až H1 a adresa, ve které došlo k chybě, spadá do DIMM_F1. Jenže mi není jasné, jak funguje ten dual channel - naivně jsem si myslel, že paměť interleavuje po malých blocích (šířka sběrnice nebo cacheline), jenže v tom dmidecode je vidět, že paměťové moduly jdou po 16 GiB. Není možné, že je chyba třeba i v modulu DIMM_E1?

    Odpovědi

    10.7.2017 18:22 Trubicoid2
    Rozbalit Rozbalit vše Re: ECC chyby a Dual-channel - který modul je vadný?
    Bych tomu dmidecode moc nevěřil. Díky tomu interleave to může být v libovolným dimmu u příslušnýho CPU. Měl jsem zato, že se interleavuje po 64 nebo 128b.

    Nejlepší možnost je postupně dimmy vyndávat, až chyba zmizí, tak to byl on :)
    Jendа avatar 10.7.2017 18:57 Jendа | skóre: 78 | blog: Jenda | JO70FB
    Rozbalit Rozbalit vše Re: ECC chyby a Dual-channel - který modul je vadný?
    Hm, super.

    To má dva problémy: DIMMy jsou blbě dostupné pod chladičem CPU a chyba se objevuje občas.
    10.7.2017 20:42 Trubicoid2
    Rozbalit Rozbalit vše Re: ECC chyby a Dual-channel - který modul je vadný?
    Chladič blbý. Ale třeba jenom tu plastovou packu na jedné straně otevřeš? Bez vytahování modulu.

    Že se chyba objevuje jen občas - tomu by se dalo pomoct. Paměti prohřát. Hodí se třeba pustit několikrát memtester podle počtu jader a dát každěmu o trošičku méně než RAM/jader, aby to těsně ještě neswapovalo.

    Pak by se chyba mohla projevit do hodiny? A můžeš experimentovat s vytahováním modulů. Klidně začni s tím, co ti vyšel podle dmidecode.
    11.7.2017 04:13 pc2005 | skóre: 38 | blog: GardenOfEdenConfiguration | liberec
    Rozbalit Rozbalit vše Re: ECC chyby a Dual-channel - který modul je vadný?
    Hmm tak zrovne můj i945gm čipset má vtipnej dualchannel kde to prokládá adresy jen když mají moduly stejnou kapacitu, jinak je řadí za sebe :-/. Ale to tvůj problém nebude.

    Osobně asi bude mít 100% účinnost to prohazování a testování modulů (pokud je chyba tam).

    Ale mohl by ses podívat do manuálu (našel jsem nějakej procík na základě tvé desky a od té generace datasheet, možná to je špatnej). Ale z těch voleb jako "Channel interleave wayness" mě teda přecházej oči :-D.

    Po zadání do googlu to našlo jednofórum, kde se to prokládání dá konfigurovat v BIOSu. Třeba tvoje deska to umí taky.
    11.7.2017 04:14 pc2005 | skóre: 38 | blog: GardenOfEdenConfiguration | liberec
    Rozbalit Rozbalit vše Re: ECC chyby a Dual-channel - který modul je vadný?
    13.7.2017 11:59 trubicoid2
    Rozbalit Rozbalit vše Re: ECC chyby a Dual-channel - který modul je vadný?
    jsou nejaky novy poznatky?
    Jendа avatar 13.7.2017 17:37 Jendа | skóre: 78 | blog: Jenda | JO70FB
    Rozbalit Rozbalit vše Re: ECC chyby a Dual-channel - který modul je vadný?
    Memtest86+ nic nenašel (vůbec nedetekuje, že mám ECC), memtester ji dokáže vyvolat.

    Vypnul jsem v BIOSu dual channel, dostal jsem jinou adresu směřující do slotu E1, vyndal jsem půlku pamětí (deska podle manuálu umí jenom 2, 4 nebo 8 slotů a já nemám žádný jiný DDR4 modul) a vyměnil modul E1 a chyba do hodiny nebyla (ale je to dost krátké testování), dal jsem do E1 zpátky podezřelý modul a chyba se objevila, ale pak jsem musel odejít.
    13.7.2017 18:02 pc2005 | skóre: 38 | blog: GardenOfEdenConfiguration | liberec
    Rozbalit Rozbalit vše Re: ECC chyby a Dual-channel - který modul je vadný?
    Jo jestli memtest86+ neumí ECC, tak je pro něj ta 1bit oprava transparentní.
    13.7.2017 18:28 trubicoid2
    Rozbalit Rozbalit vše Re: ECC chyby a Dual-channel - který modul je vadný?
    jo, memtester je na zahrati pameti dobrej :) s modulem jc42 jde teplota RAM sledovat pomoci sensors

    vetsina tech ECC chyb je citliva na teplotu

    taky zalezi, jestli je ten vadny modul alokovany a cteny nebo prazdny, vselijake ty setrice energie pak muzou zpusobit, ze se nedela ECC scrub nebo ne tak casto, kdezto cteni vzdy ECC kontrolu vyvola - memtester je na to dobry

    Založit nové vláknoNahoru

    Tiskni Sdílej: Linkuj Jaggni to Vybrali.sme.sk Google Del.icio.us Facebook

    ISSN 1214-1267   www.czech-server.cz
    © 1999-2015 Nitemedia s. r. o. Všechna práva vyhrazena.