abclinuxu.cz AbcLinuxu.cz itbiz.cz ITBiz.cz HDmag.cz HDmag.cz abcprace.cz AbcPráce.cz
Inzerujte na AbcPráce.cz od 950 Kč
Rozšířené hledání
×
    dnes 15:44 | Nová verze

    Byla vydána nová stabilní verze 6.8 (YouTube) multiplatformního frameworku a GUI toolkitu Qt. Podrobný přehled novinek v poznámkách k vydání. Jedná se o LTS verzi. Pro komerční uživatele byla prodloužena podpora ze 3 na 5 let.

    Ladislav Hagara | Komentářů: 0
    dnes 15:22 | Nová verze

    Desktopové prostředí KDE Plasma bylo vydáno ve verzi 6.2 (Mastodon, 𝕏). Přehled novinek i s videi a se snímky obrazovky v oficiálním oznámení. Podrobný přehled v seznamu změn.

    Ladislav Hagara | Komentářů: 2
    dnes 13:33 | Komunita

    Je druhé úterý v říjnu a tedy všem čtenářkám AbcLinuxu vše nejlepší k dnešnímu Dni Ady Lovelace (Ada Lovelace Day), tj. oslavy žen zabývajících se přírodními vědami, technologiemi, inženýrstvím a matematikou (STEM).

    Ladislav Hagara | Komentářů: 0
    dnes 01:00 | Nová verze

    Byla vydána nová verze 2.47.0 distribuovaného systému správy verzí Git. Přispělo 83 vývojářů, z toho 28 nových. Přehled novinek v příspěvku na blogu GitHubu a v poznámkách k vydání.

    Ladislav Hagara | Komentářů: 0
    dnes 00:11 | Nová verze Ladislav Hagara | Komentářů: 0
    včera 19:55 | Nová verze

    Programovací jazyk Python byl vydán v nové major verzi 3.13.0. Podrobný přehled novinek v changelogu.

    Ladislav Hagara | Komentářů: 0
    včera 17:11 | Zajímavý článek Ladislav Hagara | Komentářů: 4
    včera 15:22 | Pozvánky

    Konference LinuxDays 2024 proběhne již tento víkend 12. a 13. října v Praze. Na programu je spousta zajímavých přednášek a workshopů, zástup zajímavých osobností a stánky řady projektů: Fedora, openSUSE, vpsFree.cz, Mozilla, brmlab, OpenAlt a mnoho dalších. Vstup zdarma.

    Ladislav Hagara | Komentářů: 1
    včera 12:11 | IT novinky Ladislav Hagara | Komentářů: 0
    6.10. 18:55 | Nová verze

    OpenRazer byl vydán ve verzi 3.9.0. Jedná se o svobodný software, ovladač a démon, umožňující nastavovat klávesnice, notebooky, myši, podložky pod myš, keypady, sluchátka a další zařízení od společnosti Razer na GNU/Linuxu.

    Ladislav Hagara | Komentářů: 0
    Rozcestník

    Dotaz: mce: [Hardware Error] - dělat si starosti nebo ignorovat?

    6.5.2014 00:45 mpisum
    mce: [Hardware Error] - dělat si starosti nebo ignorovat?
    Přečteno: 395×
    Ahoj. Na dvou nových identických strojích se pravidelně cca 1x denně objevuje v dmesg hláška "mce: [Hardware Error]: Machine check events logged". HW: supermicro case + supermicro zdroj + supermicro deska, CPU Intel(R) Xeon(R) CPU E3-1230, 32 GB RAM, adaptec hw raid karta. Na obou strojích běží proxmox virtualizace (pouze KVM). Teploty komponent jsou v pohodě, zkoušel jsem i ladit výkon ventilátoru, jestli se to někde nepřehřívá, ale toto vypisuje i pokud má teplota CPU 28°C a teplota okolních komponent je podobná (krom disků).

    # tail -n 20 /var/log/mcelog
    MCG status:
    MCi status:
    Corrected error
    Error enabled
    MCA: Internal parity error
    STATUS 90000040000f0005 MCGSTATUS 0
    MCGCAP c09 APICID 2 SOCKETID 0 
    CPUID Vendor Intel Family 6 Model 60
    Hardware event. This is not a software error.
    MCE 0
    CPU 0 BANK 0 
    TIME 1399288245 Mon May  5 13:10:45 2014
    MCG status:
    MCi status:
    Corrected error
    Error enabled
    MCA: Internal parity error
    STATUS 90000040000f0005 MCGSTATUS 0
    MCGCAP c09 APICID 0 SOCKETID 0 
    CPUID Vendor Intel Family 6 Model 60
    
    # mcelog --client
    Memory errors
    SOCKET 0 CHANNEL 0 DIMM 0
    DMI_NAME "P1-DIMMA1" DMI_LOCATION "P0_Node0_Channel0_Dimm0"
    corrected memory errors:
    	0 total
    	0 in 24h
    uncorrected memory errors:
    	0 total
    	0 in 24h
    
    SOCKET 0 CHANNEL 0 DIMM 1
    DMI_NAME "P1-DIMMA2" DMI_LOCATION "P0_Node0_Channel0_Dimm1"
    corrected memory errors:
    	0 total
    	0 in 24h
    uncorrected memory errors:
    	0 total
    	0 in 24h
    
    SOCKET 0 CHANNEL 1 DIMM 0
    DMI_NAME "P1-DIMMB1" DMI_LOCATION "P0_Node0_Channel1_Dimm0"
    corrected memory errors:
    	0 total
    	0 in 24h
    uncorrected memory errors:
    	0 total
    	0 in 24h
    
    SOCKET 0 CHANNEL 1 DIMM 1
    DMI_NAME "P1-DIMMB2" DMI_LOCATION "P0_Node0_Channel1_Dimm1"
    corrected memory errors:
    	0 total
    	0 in 24h
    uncorrected memory errors:
    	0 total
    	0 in 24h
    
    Podle hlášek to vypadá, že chyba byla vždy opravena. Jenomže nevím, kde se chyba objevuje? RAM, CPU cache, QPI, ...? Je potřeba si dělat starosti nebo toto může být normální chování tohoto nového HW? Jde o to, že se to vyskytuje na obou strojích, tak mi přijde, že je to spíš vlastnost, ale nevím ... Jinak stroje běží naprosto spolehlivě.

    Odpovědi

    6.5.2014 11:37 trubicoid
    Rozbalit Rozbalit vše Re: mce: [Hardware Error] - dělat si starosti nebo ignorovat?
    no a nedela to na nahodou cron, kterej jednou za den pusti mcelog s nejakyma parametrama a ten pak neco napise do /var/log/mcelog?

    jestli mas ecc pameti, tak jeste zkus edac-util

    jinak na amd se ty mce dekoduji uz v jadre a mce i edac chyby jdou hned do dmesg a je z toho poznat, co se deje; mcelog na amd vubec neni potreba a taky nic nedela
    6.5.2014 18:45 mpisum
    Rozbalit Rozbalit vše Re: mce: [Hardware Error] - dělat si starosti nebo ignorovat?
    Cron to dělat nemůže. Ještě před tím než jsem měl mcelog nainstalovaný to vypisovalo Hardware errory do dmesg, ale nevěděl jsem čím to je, proto jsem tam nainstaloval mcelog. ECC paměti tam jsou, ale edac tam nefunguje.

    Založit nové vláknoNahoru

    Tiskni Sdílej: Linkuj Jaggni to Vybrali.sme.sk Google Del.icio.us Facebook

    ISSN 1214-1267   www.czech-server.cz
    © 1999-2015 Nitemedia s. r. o. Všechna práva vyhrazena.