Portál AbcLinuxu, 19. dubna 2024 15:11


Dotaz: kriticka hranice teplot CPU a RAM

22.6.2010 17:01 Pavel
kriticka hranice teplot CPU a RAM
Přečteno: 3004×
Odpovědět | Admin
Zdravim,

mame server, ktery je zrejmen spatne chlazen a resime kritickou vysi teplotu CPU a RAM. Muzete, prosim, nekdo z Vasi zkusenosti rict, jake jsou limity bezpecneho chodu 4jadroveho procesoru XEON E5335 2.0GHz a RAM Kingmax PC2-5300F 4x2GB? RAM obcas obcas dosahuji az 80 stupnu C.

Dale potrebuju vysvetlit, co znamena low a high ve vypisu sensors. Dekuji.
i5k_amb-isa-0000
Adapter: ISA adapter
Ch. 0 DIMM 0: +67.5°C  (low  = +105.0°C, high = +124.0°C)
Ch. 1 DIMM 0: +64.5°C  (low  = +105.0°C, high = +124.0°C)

coretemp-isa-0000
Adapter: ISA adapter
Core 0:      +83.0°C  (high = +86.0°C, crit = +100.0°C)

coretemp-isa-0001
Adapter: ISA adapter
Core 1:      +78.0°C  (high = +86.0°C, crit = +100.0°C)

coretemp-isa-0002
Adapter: ISA adapter
Core 2:      +83.0°C  (high = +86.0°C, crit = +100.0°C)

coretemp-isa-0003
Adapter: ISA adapter
Core 3:      +82.0°C  (high = +86.0°C, crit = +100.0°C)
Nástroje: Začni sledovat (0) ?Zašle upozornění na váš email při vložení nového komentáře.

Odpovědi

Max avatar 22.6.2010 21:16 Max | skóre: 72 | blog: Max_Devaine
Rozbalit Rozbalit vše Re: kriticka hranice teplot CPU a RAM
Odpovědět | | Sbalit | Link | Blokovat | Admin
80 stupňů je hodně. Maximální pracovní teplotu by měl mít 90 stupňů. Každopádně dlouhodobě provozovat stroj na takových teplotách, to bych se bál ;-).
Být tebou, tak bych ověřil přes nějaký dostupný management serveru, zda má skutečně takové teploty a že se lm-sensors nemýlí (není špatně nastaven).
Pokud jsou ty hodnoty skutečné, tak bych se zabýval zlepšením chlazení.
Zdar Max
PS: mně DL-380G5 s Xeonem Quad Core hlásí teplotu něco kolem 40 stupňů a větráky na 30% výkonu.
Měl jsem sen ... :(
AraxoN avatar 22.6.2010 22:25 AraxoN | skóre: 47 | blog: slon_v_porcelane | Košice
Rozbalit Rozbalit vše Re: kriticka hranice teplot CPU a RAM
Všetky druhy Xeon E5335 majú podľa stránok Intelu "Thermal Specification" 66°C. To je maximálna prípustná teplota na vrchu integrovaného heat spreaderu, t.j. tam kam sa nanáša teplovodivá pasta. Za touto teplotou už nie je zaručená správna funkcia procesora, ani to, že na procesore nedôjde k nevratným poškodeniam. Takže ak je v serverovej skrini pokazená cirkulácia vzduchu, tak to treba riešiť okamžite.
23.6.2010 11:50 frr | skóre: 34
Rozbalit Rozbalit vše Re: kriticka hranice teplot CPU a RAM
Odpovědět | | Sbalit | Link | Blokovat | Admin
LMsensors občas kecaj. Ale zrovna u DIMMů bych řekl, že mají patrně pravdu.

Vysoká teplota CPU a RAM by znamenala, že se vaří i okolní součástky (elyty a FETy ve VRM) - o ty bych měl možná větší strach, než o samotný procesor a RAMku.

Takhle vysoká teplota se vidí snad jenom u špatně poskládaných sestav. Podle procesoru je ten server relativně mladý, tam snad ještě neodešly všechny ventilátory. Nebo máte vadnou ventilaci v racku - to jsem dřív vídal docela často. Třeba úžasné skleněné dveře racku mají mizernou průvzdušnost...
[:wq]
23.6.2010 16:40 Atom321 | skóre: 20
Rozbalit Rozbalit vše Re: kriticka hranice teplot CPU a RAM
No, driver coretemp čte teplotu přímo z CPU, není tam moc prostoru k chybě. Teploty z různých čidel jsou zhruba stejné. Evidentně to tedy měří dobře.
AraxoN avatar 23.6.2010 18:31 AraxoN | skóre: 47 | blog: slon_v_porcelane | Košice
Rozbalit Rozbalit vše Re: kriticka hranice teplot CPU a RAM
Coretemp číta síce z CPU, ale tá teplota, ktorú prečíta je rozdiel ku hraničnej teplote toho CPU. Táto teplota je pre každý procesor iná, ale pokiaľ viem, tak coretemp v linuxovom jadre ju považuje za napevno 80 stupňov. U procesora, ktorý má túto teplotu vyššie (alebo nižšie) potom coretemp ukáže nesprávnu hodnotu.

Napríklad u Atomu XYZ, ktorý má Tjmax 100 stupňov to potom ukáže teplotu, ktorá je nižšia než teplota v izbe, čo je samozrejme somarina. Senzor na čipe to zoberie ako rozdiel od 100 a coretemp modul v jadre to prepočíta ako rozdiel od 80, takže výsledok, ktorý coretemp prezentuje ako teplotu CPU je posunutý o 20 stupňov smerom dole.
24.6.2010 14:06 chochi | skóre: 29 | Praha
Rozbalit Rozbalit vše Re: kriticka hranice teplot CPU a RAM
Odpovědět | | Sbalit | Link | Blokovat | Admin
Ahoj,
Je to presne jak rika AraxoN - ovladac dokaze zjistit jen offset od kriticke teploty - kritickou teplotu jenom hada.
Takze dokud nebude coretemp opraven, tak jedina moznost jak zjist aktualni teplotu je precist si spravne MSR registry.
Na to nastesti existuji programy.
Postup:

1.) Stahnout si msr-tools a zkompilovat (pokud jize nejsou v distribuci v nejakem baliku).
2.) Precist si kritickou hodnotu (ve stupnich C):

# ./rdmsr -f 23:16 -d 0x1A2 -p 0
97
3.) Precist si offset od kriticke teploty:

# ./rdmsr -f 22:16 -d 0x19C -p 0
48
4.) Vysledna teplota je prvni hodnota minus druha (97 - 48 = 49)
5.) Lze opakovat pro dalsi logicke procesory (parametr -p id)
24.6.2010 14:41 chochi | skóre: 29 | Praha
Rozbalit Rozbalit vše Re: kriticka hranice teplot CPU a RAM
Bohuzel, tohle funguje az od architektury Nahelm (ja to zkouselna Xeon E5520), takze pro Xeon E5300 je potreba najit kritickou teplotu nekde v tabulkach - buhuzel v datasheetu uvedena neni.
16.1.2011 15:19 Zymeth
Rozbalit Rozbalit vše Re: kriticka hranice teplot CPU a RAM
Tak to som ako vidim na to PEKNE ZLE! :D Môj procesor ma 120 stupnov kdyz je vsetko komplet vypnuteee, do slova, nvm proc :D Mozno ze je v blizkossti radiatoru, ale ja potom neviem xD 120 stupnov je asi dost, co? :D A potom tam mam este nejaky AUX? nwm co to je, to ma 90 stupnov :)
Chytrex avatar 16.1.2011 16:36 Chytrex | skóre: 30 | Bohumín
Rozbalit Rozbalit vše Re: kriticka hranice teplot CPU a RAM
Jen bych dodal, že jsem to testoval na i7 860 a coretemp měří dobře.. (ikdyž ten příkaz ukázal kritickou hodnotu 99) takže už to vypadá opravené
Hrdý člen KERNEL ULTRAS .:. define QUESTION ((bb) || !(bb)) .:. Odmítám vaši realitu a nahrazuji ji svou vlastní..

Založit nové vláknoNahoru

Tiskni Sdílej: Linkuj Jaggni to Vybrali.sme.sk Google Del.icio.us Facebook

ISSN 1214-1267, (c) 1999-2007 Stickfish s.r.o.