Portál AbcLinuxu, 12. května 2025 06:44

Dotaz: Falešné polašné zprávy od Zabbixe

15.11.2014 21:55 fp
Falešné polašné zprávy od Zabbixe
Přečteno: 458×
Odpovědět | Admin
Ahoj, zabbixem monitoruji několik serverů - ping + služby, switche a síťové kamery. Dohromady asi 50 zařízení. Zabbix běží jako virtuální server pod proxmoxem, do fyzického serveru je linka 2 x 1 gigabit v LACP agregaci. Každý týden v různé časy mi zabbix pošle nějaký email o krátkodobé nedostupnosti nějakého serveru - nejčastěji je to ping či TCP porty. Většinu falešných zpráv na ping jsem eliminoval tím, že jsem zvýšil timeout a kontroluji jen procento výpadku větší než nějaká hodnota - to pomohlo ale jen pro switche, protože ty hardwarově nebyly někdy schopné na ping včas odpovědět. Nyní mám tak 3-4 falešné zprávy do týdne na různé servery.

Zkontroloval jsem: Všechno vypadá v pořádku. Nenapadá vás, čím by toto mohlo být způsobené?
Nástroje: Začni sledovat (2) ?Zašle upozornění na váš email při vložení nového komentáře.

Odpovědi

17.11.2014 17:04 NN
Rozbalit Rozbalit vše Re: Falešné polašné zprávy od Zabbixe
Odpovědět | | Sbalit | Link | Blokovat | Admin
Mas implemntovanou parent/child topologii? Jak mas nastavene intervali, pocty a chovani pozitivnich i negativnich testu? Jak to vypada v logu?
18.11.2014 01:32 fp
Rozbalit Rozbalit vše Re: Falešné polašné zprávy od Zabbixe
Nemám. Je to jenom jeden server. Intervaly většinou 60sekundové, někde více. Celkový počet sledovaných položek je 1068, triggerů 445. V logu serveru jsou jen informace o startu a potom už jen housekeeper:
...
 14448:20141118:003535.266 executing housekeeper
 14448:20141118:003535.269 housekeeper [deleted 0 hist/trends, 0 items, 0 events, 0 sessions, 0 alarms, 0 audit items in 0.002182 sec, idle 1 hour(s)]
...
Falešně pozitivní bývají různé testy, následující jsou výtažky z mailů např. z 12.11. pro ssh:
PROBLEM: SSH service is down on SERVER1 v 18:10
OK: SSH service is down on SERVER1 v 18:11
PROBLEM: SSH service is down on SERVER2 v 18:37
OK: SSH service is down on SERVER2 v 18:38
nebo 13.11. pro DNS zónu:
PROBLEM: DNS zone domena.moje on dns1 is not ok v 18:31
OK: DNS zone domena.moje on dns1 is not ok v 18:32

trigger:
{Zabbix server:net.dns[X.X.X.X,domena.moje,NS].last(0)}#1
18.11.2014 13:38 NN
Rozbalit Rozbalit vše Re: Falešné polašné zprávy od Zabbixe
Pomoci 'trigger dependenci' by bylo mozne odhalit konkretni uzel na kterem to vazne a upresnit tak misto problemu.
19.11.2014 05:25 fp
Rozbalit Rozbalit vše Re: Falešné polašné zprávy od Zabbixe
Jak? Když mám třeba falešně pozitivní zprávy od 2 vzájemně nezávislých serverů, tak jak by to využil?
17.11.2014 20:05 Ivan
Rozbalit Rozbalit vše Re: Falešné polašné zprávy od Zabbixe
Odpovědět | | Sbalit | Link | Blokovat | Admin
Zkus presunout monitoring na fyzicky server. Popr muzes zkusit vypnout offloading na sitovce fyzickeho serveru. A uvidis. Dneska vsichni resi kolik porna se jim stahne za hodinu po jejich super giga sitovce, ale kdyz prijde na maly packety (Ping/SNMP) tak nikdo poradne netusi.

18.11.2014 01:40 fp
Rozbalit Rozbalit vše Re: Falešné polašné zprávy od Zabbixe
Na fyzický server nejsou finance, nicméně ten virtuál je na relativně výkonném serveru navíc v LAN síti. Přetížené to nebude, třeba výše zmíněné výpadky byly detekované v době nejmenšího zatížení serveru i celé sítě - pakety za sekundu nemonitoruji, ale IOPS disku OK a celkový datový provoz 300kbps na celém hostitelském serveru.
18.11.2014 09:48 Ivan
Rozbalit Rozbalit vše Re: Falešné polašné zprávy od Zabbixe
Nemas sitovku od Intelu? Mozna by pomohl novejsi firmware. Popr. zkus porovnat pocet packetu na pocitadle na portu u switche vs. pocet packetu na sitovce v Linuxu.
19.11.2014 05:32 fp
Rozbalit Rozbalit vše Re: Falešné polašné zprávy od Zabbixe
Mám, 2x integrovaná na supermicro desce. Ostatní spojení ale jede bez problému. I pokud běží zálohování virtuálních mašin přes rsync - stovky tisíc malých souborů - žádný problém. Ping z toho stroje bez výpadku. Pokud by tam byl problém tak ho asi počítáním paketů nezjistím. Síťovka ale asi bude OK.

Založit nové vláknoNahoru

Tiskni Sdílej: Linkuj Jaggni to Vybrali.sme.sk Google Del.icio.us Facebook

ISSN 1214-1267, (c) 1999-2007 Stickfish s.r.o.