abclinuxu.cz AbcLinuxu.cz itbiz.cz ITBiz.cz HDmag.cz HDmag.cz abcprace.cz AbcPráce.cz
AbcLinuxu hledá autory!
Inzerujte na AbcPráce.cz od 950 Kč
Rozšířené hledání
×
    dnes 16:33 | IT novinky

    Bylo oznámeno, že Qualcomm kupuje Arduino. Současně byla představena nová deska Arduino UNO Q se dvěma čipy: MPU Qualcomm Dragonwing QRB2210, na kterém může běžet Linux, a MCU STM32U585 a vývojové prostředí Arduino App Lab.

    Ladislav Hagara | Komentářů: 0
    dnes 15:55 | Nová verze

    Multiplatformní open source voxelový herní engine Luanti byl vydán ve verzi 5.14.0. Podrobný přehled novinek v changelogu. Původně se jedná o Minecraftem inspirovaný Minetest v říjnu loňského roku přejmenovaný na Luanti.

    Ladislav Hagara | Komentářů: 0
    dnes 13:22 | Nová verze

    Byla vydána nová stabilní verze 6.10 (YouTube) multiplatformního frameworku a GUI toolkitu Qt. Podrobný přehled novinek v poznámkách k vydání.

    Ladislav Hagara | Komentářů: 0
    včera 23:55 | Komunita

    Ubuntu 26.04 LTS bude (𝕏) Resolute Raccoon (rezolutní mýval).

    Ladislav Hagara | Komentářů: 2
    včera 21:00 | Nová verze

    Netwide Assembler (NASM) byl vydán v nové major verzi 3.00. Přehled novinek v poznámkách k vydání v aktualizované dokumentaci.

    Ladislav Hagara | Komentářů: 0
    včera 20:11 | Komunita

    Linuxová distribuce Frugalware (Wikipedie) ke konci roku 2025 oficiálně končí.

    Ladislav Hagara | Komentářů: 0
    včera 17:22 | Nová verze

    Byla vydána nová verze 3.0.6 svobodné aplikace pro úpravu a vytváření rastrové grafiky GIMP (GNU Image Manipulation Program). Přehled novinek v oznámení o vydání a v souboru NEWS na GitLabu. Nový GIMP bude brzy k dispozici také na Flathubu.

    Ladislav Hagara | Komentářů: 0
    včera 16:11 | IT novinky

    Americký výrobce čipů AMD uzavřel s americkou společností OpenAI smlouvu na několikaleté dodávky vyspělých mikročipů pro umělou inteligenci (AI). Součástí dohody je i předkupní právo OpenAI na přibližně desetiprocentní podíl v AMD.

    Ladislav Hagara | Komentářů: 1
    včera 12:22 | Nová verze Ladislav Hagara | Komentářů: 0
    5.10. 20:00 | Komunita

    Byly zpracovány a na YouTube zveřejněny videozáznamy z konference LinuxDays 2025.

    Ladislav Hagara | Komentářů: 0
    Jaké řešení používáte k vývoji / práci?
     (39%)
     (45%)
     (16%)
     (17%)
     (21%)
     (16%)
     (18%)
     (16%)
     (16%)
    Celkem 187 hlasů
     Komentářů: 12, poslední 4.10. 20:35
    Rozcestník

    Dotaz: mce: [Hardware Error] - dělat si starosti nebo ignorovat?

    6.5.2014 00:45 mpisum
    mce: [Hardware Error] - dělat si starosti nebo ignorovat?
    Přečteno: 423×
    Ahoj. Na dvou nových identických strojích se pravidelně cca 1x denně objevuje v dmesg hláška "mce: [Hardware Error]: Machine check events logged". HW: supermicro case + supermicro zdroj + supermicro deska, CPU Intel(R) Xeon(R) CPU E3-1230, 32 GB RAM, adaptec hw raid karta. Na obou strojích běží proxmox virtualizace (pouze KVM). Teploty komponent jsou v pohodě, zkoušel jsem i ladit výkon ventilátoru, jestli se to někde nepřehřívá, ale toto vypisuje i pokud má teplota CPU 28°C a teplota okolních komponent je podobná (krom disků).

    # tail -n 20 /var/log/mcelog
    MCG status:
    MCi status:
    Corrected error
    Error enabled
    MCA: Internal parity error
    STATUS 90000040000f0005 MCGSTATUS 0
    MCGCAP c09 APICID 2 SOCKETID 0 
    CPUID Vendor Intel Family 6 Model 60
    Hardware event. This is not a software error.
    MCE 0
    CPU 0 BANK 0 
    TIME 1399288245 Mon May  5 13:10:45 2014
    MCG status:
    MCi status:
    Corrected error
    Error enabled
    MCA: Internal parity error
    STATUS 90000040000f0005 MCGSTATUS 0
    MCGCAP c09 APICID 0 SOCKETID 0 
    CPUID Vendor Intel Family 6 Model 60
    
    # mcelog --client
    Memory errors
    SOCKET 0 CHANNEL 0 DIMM 0
    DMI_NAME "P1-DIMMA1" DMI_LOCATION "P0_Node0_Channel0_Dimm0"
    corrected memory errors:
    	0 total
    	0 in 24h
    uncorrected memory errors:
    	0 total
    	0 in 24h
    
    SOCKET 0 CHANNEL 0 DIMM 1
    DMI_NAME "P1-DIMMA2" DMI_LOCATION "P0_Node0_Channel0_Dimm1"
    corrected memory errors:
    	0 total
    	0 in 24h
    uncorrected memory errors:
    	0 total
    	0 in 24h
    
    SOCKET 0 CHANNEL 1 DIMM 0
    DMI_NAME "P1-DIMMB1" DMI_LOCATION "P0_Node0_Channel1_Dimm0"
    corrected memory errors:
    	0 total
    	0 in 24h
    uncorrected memory errors:
    	0 total
    	0 in 24h
    
    SOCKET 0 CHANNEL 1 DIMM 1
    DMI_NAME "P1-DIMMB2" DMI_LOCATION "P0_Node0_Channel1_Dimm1"
    corrected memory errors:
    	0 total
    	0 in 24h
    uncorrected memory errors:
    	0 total
    	0 in 24h
    
    Podle hlášek to vypadá, že chyba byla vždy opravena. Jenomže nevím, kde se chyba objevuje? RAM, CPU cache, QPI, ...? Je potřeba si dělat starosti nebo toto může být normální chování tohoto nového HW? Jde o to, že se to vyskytuje na obou strojích, tak mi přijde, že je to spíš vlastnost, ale nevím ... Jinak stroje běží naprosto spolehlivě.

    Odpovědi

    6.5.2014 11:37 trubicoid
    Rozbalit Rozbalit vše Re: mce: [Hardware Error] - dělat si starosti nebo ignorovat?
    no a nedela to na nahodou cron, kterej jednou za den pusti mcelog s nejakyma parametrama a ten pak neco napise do /var/log/mcelog?

    jestli mas ecc pameti, tak jeste zkus edac-util

    jinak na amd se ty mce dekoduji uz v jadre a mce i edac chyby jdou hned do dmesg a je z toho poznat, co se deje; mcelog na amd vubec neni potreba a taky nic nedela
    6.5.2014 18:45 mpisum
    Rozbalit Rozbalit vše Re: mce: [Hardware Error] - dělat si starosti nebo ignorovat?
    Cron to dělat nemůže. Ještě před tím než jsem měl mcelog nainstalovaný to vypisovalo Hardware errory do dmesg, ale nevěděl jsem čím to je, proto jsem tam nainstaloval mcelog. ECC paměti tam jsou, ale edac tam nefunguje.

    Založit nové vláknoNahoru

    Tiskni Sdílej: Linkuj Jaggni to Vybrali.sme.sk Google Del.icio.us Facebook

    ISSN 1214-1267   www.czech-server.cz
    © 1999-2015 Nitemedia s. r. o. Všechna práva vyhrazena.