Portál AbcLinuxu, 30. dubna 2024 14:16


Dotaz: Server se sám vypíná

Jan Šimek avatar 2.7.2017 11:54 Jan Šimek | skóre: 7
Server se sám vypíná
Přečteno: 507×
Odpovědět | Admin
Mám ve sklepě domácí server, který se z ničeho nic po nějakém čase sám vypne nebo najede do úvodní obrazovky BIOSU. Někdy jede týdny a jindy se to stane pár hodin po bootu. V té místnosti je dost vedro, tak mě jako první napadlo, jestli se nepřehřívá, ale z výpisu lm_sensors a hddtemp se mi nezdá:
$ sensors
k10temp-pci-00c3
Adapter: PCI adapter
temp1:        +31.5°C  (high = +70.0°C)

f71889ed-isa-0500
Adapter: ISA adapter
+3.3V:        +3.34 V  
in1:          +1.02 V  (max =  +2.04 V)
in2:          +1.61 V  
in3:          +0.94 V  
in4:          +1.10 V  
in5:          +1.28 V  
in6:          +1.27 V  
3VSB:         +3.20 V  
Vbat:         +3.18 V  
fan1:        3649 RPM
fan2:           0 RPM  ALARM
fan3:           0 RPM  ALARM
temp1:        +46.0°C  (high = +255.0°C, hyst = +251.0°C)  ALARM (CRIT)
                       (crit = +255.0°C, hyst = +251.0°C)  sensor = transistor
temp2:          FAULT  (high = +255.0°C, hyst = +251.0°C)
                       (crit = +255.0°C, hyst = +251.0°C)  sensor = transistor
temp3:        +42.0°C  (high = +255.0°C, hyst = +253.0°C)  ALARM (CRIT)
                       (crit = +255.0°C, hyst = +253.0°C)  sensor = transistor
a teploty disků podle hddtemp jsou vyšší(?), ale pořád v normálu: |/dev/sda|WDC WD30EFRX-68EUZN0|36|C||/dev/sdb|WDC WD20EARS-00J2GB0|38|C||/dev/sdc|SAMSUNG HD500LJ|32|C|
Linux/Arch, x86_64, kernel 4.11.6-3-ARCH, MB: MSI 890GXM-G65 (MS-7642)
CPUs (2)	
AuthenticAMD - AMD Phenom(tm) II X2 555 Processor (800.000 MHz) (21.65%)
AuthenticAMD - AMD Phenom(tm) II X2 555 Processor (800.000 MHz) (3.92%)
Overall CPU Usage 12.5%
Load	1.14 1.08 0.92
Processes	running: 3; zombie: 0; sleeping: 158; stopped: 0; total: 162
Threads	190
Active Users	1
Co bych ještě měl zkontrolovat?


Řešení dotazu:


Nástroje: Začni sledovat (0) ?Zašle upozornění na váš email při vložení nového komentáře.

Odpovědi

2.7.2017 12:37 NN
Rozbalit Rozbalit vše Re: Server se sám vypíná
Odpovědět | | Sbalit | Link | Blokovat | Admin
Ma deska nejakou diagnostiku od vyrobce?
2.7.2017 13:05 R
Rozbalit Rozbalit vše Re: Server se sám vypíná
Odpovědět | | Sbalit | Link | Blokovat | Admin
Pozri do zdroja, ci nemas nafuknute kondenzatory.
2.7.2017 18:39 pc2005 | skóre: 38 | blog: GardenOfEdenConfiguration | liberec
Rozbalit Rozbalit vše Re: Server se sám vypíná
Jo taky bych to viděl na ATX zdroj nebo filtraci na MB. I když teda mě to nikdy nenabíhalo do BIOSu (snad jedině když byla vybitá CMOS baterka).
Řešení 1× (Jan Šimek (tazatel))
3.7.2017 14:56 trubicoid2
Rozbalit Rozbalit vše Re: Server se sám vypíná
Odpovědět | | Sbalit | Link | Blokovat | Admin
Mam Phenom(tm) II X6 1045T v ASUS M4A88TD-M EVO a prehrival se NB. Je tam takovej pasivni chladic, ale kdyz mam na CPU vodnika, tak to kolem toho pasivu vubec nefoukalo a prehrival se, ze na nej neslo sahnout. Pridal jsem velkej pomalej vetrak a ted ukazuje:
temp1:        +45.0°C  (low  = -15.0°C, high = -24.0°C)  sensor = thermistor
temp2:        +38.0°C  (low  = -37.0°C, high =  -5.0°C)  sensor = thermistor>
Prvni je CPU, druhy NB.

Jako prvni bych asi zkusil vyprovokovat to zatuhnuti zatizenim pocitace, hodi se nekolikrat pustit burnK7 (na kazdym jadru jednou, u tebe 2x) a pockat vic jak hodinu, kdyz nezatuhne - chlazenim CPU to asi nebude

na NB se hodi dvakrat pustit burnMMX P

oboje z baliku cpuburn

jestli ani na jednom po vic jak hodine nezatuhne, tak to asi chlazenim nebude (ale typuju ze asi jo)

pak bych zkusil asi memtest86+, jestli neni neco s pametima
3.7.2017 19:48 trubicoid2
Rozbalit Rozbalit vše Re: Server se sám vypíná
jeste se muze hodit tpc, sam si zkompiluj

potom po tom povareni tim 2x burnK7 koukni na
./TurionPowerControl -htc
TurionPowerControl 0.44-rc2 (export)
Turion Power States Optimization and Control - by blackshard

Hardware Thermal Control Status:

 --- Node 0:
HTC features enabled flag: true. Hardware Thermal Control is enabled.
HTC features currently active (means overheating): false
HTC features has been active (means overheated in past): false
HTC parameters are locked: false
HTC Slew control: by Tctl without Slew register
HTC Limit temperature (equal or above means overheating): 100
HTC Hysteresis temperature (equal or below means no more overheating) : 95
HTC PState Limit: 2

Done.
dulezity je true na prvnim radku a zasadni je false na tretim, jestli je tam true, tak se cpu prehriva a zpomaluje a muze se i vypnout
Jan Šimek avatar 4.7.2017 09:10 Jan Šimek | skóre: 7
Rozbalit Rozbalit vše Re: Server se sám vypíná
Tak tímhle jsem ho odpálil během 5 vteřin. Z toho jsem tedy pochopil, že problém je v uchlazení CPU při zátěži
4.7.2017 10:53 trubicoid2
Rozbalit Rozbalit vše Re: Server se sám vypíná
tim 2x burnK7? tak to bude chlazeni cpu, mozna vyschla pasta? nedolehajici chladic?

jak to budes mit rozebrany, tak zkus sahnout taky na ty pasivni chladice za chodu bez zateze (jestli je tam mas), ten muj byl urcite pres 50C, nesla na nem udrzet ruka ani sekundu
4.7.2017 12:09 trubicoid2
Rozbalit Rozbalit vše Re: Server se sám vypíná
jeste je mozny, ze zkontrolujes chladic, pastu a porad nic - tim padem to bude ve zdroji nebo v kondenzatorove kaskade jak tu uz radili - ten burnK7 zvedne spotrebu a napeti na procesoru a muze to vadny zdroj rozkolisat a tim to padne

nejlepsi by bylo koukat taky na ten Turionpowercontrol, jestli si CPU mysli, ze se prehriva

Založit nové vláknoNahoru

Tiskni Sdílej: Linkuj Jaggni to Vybrali.sme.sk Google Del.icio.us Facebook

ISSN 1214-1267, (c) 1999-2007 Stickfish s.r.o.