abclinuxu.cz AbcLinuxu.cz itbiz.cz ITBiz.cz HDmag.cz HDmag.cz abcprace.cz AbcPráce.cz
AbcLinuxu hledá autory!
Inzerujte na AbcPráce.cz od 950 Kč
Rozšířené hledání
×
    dnes 12:44 | Nová verze

    Po AlmaLinuxu byl v nové stabilní verzi 10.1 vydán také Rocky Linux. Přehled novinek v poznámkách k vydání.

    Ladislav Hagara | Komentářů: 0
    dnes 04:00 | Zajímavý software

    Open source reimplementace počítačových her Tomb Raider I a Tomb Raider II spolu s dalšími vylepšeními a opravami chyb TRX byla vydána ve verzi 1.0. Jedná se o sloučení projektů / enginů TR1X a TR2X do jednoho TRX. Videoukázka na YouTube.

    Ladislav Hagara | Komentářů: 1
    včera 17:00 | IT novinky

    Společnost Seznam.cz spouští konverzační nástroj založený na umělé inteligenci Seznam Asistent. Asistent využívá vlastní jazykový model SeLLMa a dočasně i komerční modely od OpenAI provozované v evropských datacentrech prostřednictvím Microsoft Azure. Dlouhodobým cílem Seznamu je provozovat Asistenta výhradně na interních jazykových modelech a ve vlastních datových centrech.

    Ladislav Hagara | Komentářů: 5
    včera 11:55 | Zajímavý software

    Software LibrePods osvobozuje bezdrátová sluchátka AirPods z ekosystému Applu. Exkluzivní funkce AirPods umožňuje využívat na Androidu a Linuxu. Díky zdokumentování proprietárního protokolu AAP (Apple Accessory Protocol).

    Ladislav Hagara | Komentářů: 1
    včera 05:00 | Nová verze

    Byl vydán AlmaLinux OS 10.1 s kódovým názvem Heliotrope Lion. S podporou Btrfs. Podrobnosti v poznámkách k vydání.

    Ladislav Hagara | Komentářů: 0
    včera 04:33 | Komunita

    Placená služba prohledávání zprostředkovatelů dat a automatického odstraňování uniklých osobních údajů Mozilla Monitor Plus bude 17. prosince ukončena. Bezplatná monitorovací služba Mozilla Monitor bude i nadále poskytovat okamžitá upozornění a podrobné pokyny k omezení rizik úniku dat. Služba Mozilla Monitor Plus byla představena v únoru loňského roku.

    Ladislav Hagara | Komentářů: 0
    24.11. 22:44 | Nová verze

    Waydroid (Wikipedie, GitHub) byl vydán v nové verzi 1.6.0. Waydroid umožňuje spouštět aplikace pro Android na běžných linuxových distribucích. Běhové prostředí vychází z LineageOS.

    Ladislav Hagara | Komentářů: 4
    24.11. 15:44 | Nová verze

    Příspěvek na blogu Raspberry Pi představuje novou kompletně přepracovanou verzi 2.0 aplikace Raspberry Pi Imager (YouTube) pro stažení, nakonfigurování a zapsání obrazu operačního systému pro Raspberry Pi na SD kartu. Z novinek lze vypíchnout volitelnou konfiguraci Raspberry Pi Connect.

    Ladislav Hagara | Komentářů: 3
    24.11. 11:22 | Nová verze

    Memtest86+ (Wikipedie), svobodný nástroj pro kontrolu operační paměti, byl vydán ve verzi 8.00. Přináší podporu nejnovějších procesorů Intel a AMD nebo také tmavý režim.

    Ladislav Hagara | Komentářů: 0
    24.11. 10:55 | Nová verze

    Programovací jazyk Racket (Wikipedie), tj. jazyk z rodiny jazyků Lisp a potomek jazyka Scheme, byl vydán v nové major verzi 9.0. Hlavní novinku jsou paralelní vlákna (Parallel Threads).

    Ladislav Hagara | Komentářů: 0
    Jaké řešení používáte k vývoji / práci?
     (35%)
     (46%)
     (19%)
     (18%)
     (22%)
     (15%)
     (23%)
     (16%)
     (17%)
    Celkem 401 hlasů
     Komentářů: 17, poslední 19.11. 21:57
    Rozcestník

    Dotaz: mce: [Hardware Error] - dělat si starosti nebo ignorovat?

    6.5.2014 00:45 mpisum
    mce: [Hardware Error] - dělat si starosti nebo ignorovat?
    Přečteno: 429×
    Ahoj. Na dvou nových identických strojích se pravidelně cca 1x denně objevuje v dmesg hláška "mce: [Hardware Error]: Machine check events logged". HW: supermicro case + supermicro zdroj + supermicro deska, CPU Intel(R) Xeon(R) CPU E3-1230, 32 GB RAM, adaptec hw raid karta. Na obou strojích běží proxmox virtualizace (pouze KVM). Teploty komponent jsou v pohodě, zkoušel jsem i ladit výkon ventilátoru, jestli se to někde nepřehřívá, ale toto vypisuje i pokud má teplota CPU 28°C a teplota okolních komponent je podobná (krom disků).

    # tail -n 20 /var/log/mcelog
    MCG status:
    MCi status:
    Corrected error
    Error enabled
    MCA: Internal parity error
    STATUS 90000040000f0005 MCGSTATUS 0
    MCGCAP c09 APICID 2 SOCKETID 0 
    CPUID Vendor Intel Family 6 Model 60
    Hardware event. This is not a software error.
    MCE 0
    CPU 0 BANK 0 
    TIME 1399288245 Mon May  5 13:10:45 2014
    MCG status:
    MCi status:
    Corrected error
    Error enabled
    MCA: Internal parity error
    STATUS 90000040000f0005 MCGSTATUS 0
    MCGCAP c09 APICID 0 SOCKETID 0 
    CPUID Vendor Intel Family 6 Model 60
    
    # mcelog --client
    Memory errors
    SOCKET 0 CHANNEL 0 DIMM 0
    DMI_NAME "P1-DIMMA1" DMI_LOCATION "P0_Node0_Channel0_Dimm0"
    corrected memory errors:
    	0 total
    	0 in 24h
    uncorrected memory errors:
    	0 total
    	0 in 24h
    
    SOCKET 0 CHANNEL 0 DIMM 1
    DMI_NAME "P1-DIMMA2" DMI_LOCATION "P0_Node0_Channel0_Dimm1"
    corrected memory errors:
    	0 total
    	0 in 24h
    uncorrected memory errors:
    	0 total
    	0 in 24h
    
    SOCKET 0 CHANNEL 1 DIMM 0
    DMI_NAME "P1-DIMMB1" DMI_LOCATION "P0_Node0_Channel1_Dimm0"
    corrected memory errors:
    	0 total
    	0 in 24h
    uncorrected memory errors:
    	0 total
    	0 in 24h
    
    SOCKET 0 CHANNEL 1 DIMM 1
    DMI_NAME "P1-DIMMB2" DMI_LOCATION "P0_Node0_Channel1_Dimm1"
    corrected memory errors:
    	0 total
    	0 in 24h
    uncorrected memory errors:
    	0 total
    	0 in 24h
    
    Podle hlášek to vypadá, že chyba byla vždy opravena. Jenomže nevím, kde se chyba objevuje? RAM, CPU cache, QPI, ...? Je potřeba si dělat starosti nebo toto může být normální chování tohoto nového HW? Jde o to, že se to vyskytuje na obou strojích, tak mi přijde, že je to spíš vlastnost, ale nevím ... Jinak stroje běží naprosto spolehlivě.

    Odpovědi

    6.5.2014 11:37 trubicoid
    Rozbalit Rozbalit vše Re: mce: [Hardware Error] - dělat si starosti nebo ignorovat?
    no a nedela to na nahodou cron, kterej jednou za den pusti mcelog s nejakyma parametrama a ten pak neco napise do /var/log/mcelog?

    jestli mas ecc pameti, tak jeste zkus edac-util

    jinak na amd se ty mce dekoduji uz v jadre a mce i edac chyby jdou hned do dmesg a je z toho poznat, co se deje; mcelog na amd vubec neni potreba a taky nic nedela
    6.5.2014 18:45 mpisum
    Rozbalit Rozbalit vše Re: mce: [Hardware Error] - dělat si starosti nebo ignorovat?
    Cron to dělat nemůže. Ještě před tím než jsem měl mcelog nainstalovaný to vypisovalo Hardware errory do dmesg, ale nevěděl jsem čím to je, proto jsem tam nainstaloval mcelog. ECC paměti tam jsou, ale edac tam nefunguje.

    Založit nové vláknoNahoru

    Tiskni Sdílej: Linkuj Jaggni to Vybrali.sme.sk Google Del.icio.us Facebook

    ISSN 1214-1267   www.czech-server.cz
    © 1999-2015 Nitemedia s. r. o. Všechna práva vyhrazena.