abclinuxu.cz AbcLinuxu.cz itbiz.cz ITBiz.cz HDmag.cz HDmag.cz abcprace.cz AbcPráce.cz
AbcLinuxu hledá autory!
Inzerujte na AbcPráce.cz od 950 Kč
Rozšířené hledání
×
    dnes 15:22 | Nová verze

    Byla vydána nová verze 18 integrovaného vývojového prostředí (IDE) Qt Creator. S podporou Development Containers. Podrobný přehled novinek v changelogu.

    Ladislav Hagara | Komentářů: 0
    dnes 12:55 | Nová verze

    Cursor (Wikipedie) od společnosti Anysphere byl vydán ve verzi 2.0. Jedná se o multiplatformní proprietární editor kódů s podporou AI (vibe coding).

    Ladislav Hagara | Komentářů: 1
    dnes 02:55 | Nová verze

    Google Chrome 142 byl prohlášen za stabilní. Nejnovější stabilní verze 142.0.7444.59 přináší řadu novinek z hlediska uživatelů i vývojářů. Podrobný přehled v poznámkách k vydání. Opraveno bylo 20 bezpečnostních chyb. Za nejvážnější z nich bylo vyplaceno 50 000 dolarů. Vylepšeny byly také nástroje pro vývojáře.

    Ladislav Hagara | Komentářů: 0
    dnes 01:22 | IT novinky Ladislav Hagara | Komentářů: 0
    včera 17:00 | Upozornění

    Národní identitní autorita, tedy NIA ID, MeG a eOP jsou nedostupné. Na nápravě se pracuje [𝕏].

    Ladislav Hagara | Komentářů: 9
    včera 16:44 | IT novinky

    Americký výrobce čipů Nvidia se stal první firmou na světě, jejíž tržní hodnota dosáhla pěti bilionů USD (104,5 bilionu Kč). Nvidia stojí v čele světového trhu s čipy pro umělou inteligenci (AI) a výrazně těží z prudkého růstu zájmu o tuto technologii. Nvidia již byla první firmou, která překonala hranici čtyř bilionů USD, a to letos v červenci.

    Ladislav Hagara | Komentářů: 6
    včera 14:11 | Komunita

    Po Canonicalu a SUSE oznámil také Red Hat, že bude podporovat a distribuovat toolkit NVIDIA CUDA (Wikipedie).

    Ladislav Hagara | Komentářů: 2
    včera 13:55 | Nová verze

    TrueNAS (Wikipedie), tj. open source storage platforma postavená na Linuxu, byl vydán ve verzi 25.10 Goldeye. Přináší NVMe over Fabric (NVMe-oF) nebo OpenZFS 2.3.4.

    Ladislav Hagara | Komentářů: 0
    včera 13:33 | Nová verze

    Byla vydána OpenIndiana 2025.10. Unixový operační systém OpenIndiana (Wikipedie) vychází z OpenSolarisu (Wikipedie).

    Ladislav Hagara | Komentářů: 0
    včera 13:22 | Zajímavý článek

    České základní a střední školy čelí alarmujícímu stavu kybernetické bezpečnosti. Až 89 % identifikovaných zranitelností v IT infrastruktuře vzdělávacích institucí dosahuje kritické úrovně, což znamená, že útočníci mohou vzdáleně převzít kontrolu nad klíčovými systémy. Školy navíc často provozují zastaralé technologie, i roky nechávají zařízení bez potřebných aktualizací softwaru a používají k nim pouze výchozí, všeobecně známá

    … více »
    Ladislav Hagara | Komentářů: 16
    Jaké řešení používáte k vývoji / práci?
     (36%)
     (48%)
     (19%)
     (19%)
     (22%)
     (17%)
     (21%)
     (16%)
     (17%)
    Celkem 285 hlasů
     Komentářů: 14, poslední 14.10. 09:04
    Rozcestník

    Dotaz: mce: [Hardware Error] - dělat si starosti nebo ignorovat?

    6.5.2014 00:45 mpisum
    mce: [Hardware Error] - dělat si starosti nebo ignorovat?
    Přečteno: 429×
    Ahoj. Na dvou nových identických strojích se pravidelně cca 1x denně objevuje v dmesg hláška "mce: [Hardware Error]: Machine check events logged". HW: supermicro case + supermicro zdroj + supermicro deska, CPU Intel(R) Xeon(R) CPU E3-1230, 32 GB RAM, adaptec hw raid karta. Na obou strojích běží proxmox virtualizace (pouze KVM). Teploty komponent jsou v pohodě, zkoušel jsem i ladit výkon ventilátoru, jestli se to někde nepřehřívá, ale toto vypisuje i pokud má teplota CPU 28°C a teplota okolních komponent je podobná (krom disků).

    # tail -n 20 /var/log/mcelog
    MCG status:
    MCi status:
    Corrected error
    Error enabled
    MCA: Internal parity error
    STATUS 90000040000f0005 MCGSTATUS 0
    MCGCAP c09 APICID 2 SOCKETID 0 
    CPUID Vendor Intel Family 6 Model 60
    Hardware event. This is not a software error.
    MCE 0
    CPU 0 BANK 0 
    TIME 1399288245 Mon May  5 13:10:45 2014
    MCG status:
    MCi status:
    Corrected error
    Error enabled
    MCA: Internal parity error
    STATUS 90000040000f0005 MCGSTATUS 0
    MCGCAP c09 APICID 0 SOCKETID 0 
    CPUID Vendor Intel Family 6 Model 60
    
    # mcelog --client
    Memory errors
    SOCKET 0 CHANNEL 0 DIMM 0
    DMI_NAME "P1-DIMMA1" DMI_LOCATION "P0_Node0_Channel0_Dimm0"
    corrected memory errors:
    	0 total
    	0 in 24h
    uncorrected memory errors:
    	0 total
    	0 in 24h
    
    SOCKET 0 CHANNEL 0 DIMM 1
    DMI_NAME "P1-DIMMA2" DMI_LOCATION "P0_Node0_Channel0_Dimm1"
    corrected memory errors:
    	0 total
    	0 in 24h
    uncorrected memory errors:
    	0 total
    	0 in 24h
    
    SOCKET 0 CHANNEL 1 DIMM 0
    DMI_NAME "P1-DIMMB1" DMI_LOCATION "P0_Node0_Channel1_Dimm0"
    corrected memory errors:
    	0 total
    	0 in 24h
    uncorrected memory errors:
    	0 total
    	0 in 24h
    
    SOCKET 0 CHANNEL 1 DIMM 1
    DMI_NAME "P1-DIMMB2" DMI_LOCATION "P0_Node0_Channel1_Dimm1"
    corrected memory errors:
    	0 total
    	0 in 24h
    uncorrected memory errors:
    	0 total
    	0 in 24h
    
    Podle hlášek to vypadá, že chyba byla vždy opravena. Jenomže nevím, kde se chyba objevuje? RAM, CPU cache, QPI, ...? Je potřeba si dělat starosti nebo toto může být normální chování tohoto nového HW? Jde o to, že se to vyskytuje na obou strojích, tak mi přijde, že je to spíš vlastnost, ale nevím ... Jinak stroje běží naprosto spolehlivě.

    Odpovědi

    6.5.2014 11:37 trubicoid
    Rozbalit Rozbalit vše Re: mce: [Hardware Error] - dělat si starosti nebo ignorovat?
    no a nedela to na nahodou cron, kterej jednou za den pusti mcelog s nejakyma parametrama a ten pak neco napise do /var/log/mcelog?

    jestli mas ecc pameti, tak jeste zkus edac-util

    jinak na amd se ty mce dekoduji uz v jadre a mce i edac chyby jdou hned do dmesg a je z toho poznat, co se deje; mcelog na amd vubec neni potreba a taky nic nedela
    6.5.2014 18:45 mpisum
    Rozbalit Rozbalit vše Re: mce: [Hardware Error] - dělat si starosti nebo ignorovat?
    Cron to dělat nemůže. Ještě před tím než jsem měl mcelog nainstalovaný to vypisovalo Hardware errory do dmesg, ale nevěděl jsem čím to je, proto jsem tam nainstaloval mcelog. ECC paměti tam jsou, ale edac tam nefunguje.

    Založit nové vláknoNahoru

    Tiskni Sdílej: Linkuj Jaggni to Vybrali.sme.sk Google Del.icio.us Facebook

    ISSN 1214-1267   www.czech-server.cz
    © 1999-2015 Nitemedia s. r. o. Všechna práva vyhrazena.