Portál AbcLinuxu, 19. května 2024 02:19


Dotaz: Monitoring a možnosti vyhodnocení stavu

25.3.2013 15:03 KPipa
Monitoring a možnosti vyhodnocení stavu
Přečteno: 210×
Odpovědět | Admin

Ahoj. Prosím o typ na monitorovací software, který by splnil následující požadavky:

- monitorování serverů, switchů, storage

- odesílání notifikací o nedostupnosti služeb

:-) a teď ten háček: Před odesláním notifikací nejdříve vyhodnotit stav závislostí.

 

Například:

* výpadek pingu na server ... odeslat Notifikaci Critical Ping IP "server"

* výpadek LANswitch ... Neposílat Notifikaci o nedostupnosti serverů a storage ale jenom o LANswitch

* výpadek FCswitch ... odeslat Notifikaci Data not availability

Asi to nedokážu lépe popsat, ale cílem je Notifikace která obsahuje informaci o ne/dostupnosti služby a NÉ jen popis chyb z jednotlivých zařízení které službu poskytují.

 

Takto upravený výstup Notifikace bych rád odeslal jako SMS. Na email bych odesílal neupravené původní zprávy z Notifikace pro snadnější rozbor situace.

 

Zatím používám nagios 3.2.1 Výpadek LANswitche vygeneruje cca 20 sms notifikací se seznamem nedostupných zařízení(serverů,fcswitch,storage).

Budu rád za jakoukoliv radu.

Díky.

Nástroje: Začni sledovat (0) ?Zašle upozornění na váš email při vložení nového komentáře.

Odpovědi

25.3.2013 15:12 johnyBeGood
Rozbalit Rozbalit vše Re: Monitoring a možnosti vyhodnocení stavu
Odpovědět | | Sbalit | Link | Blokovat | Admin
Nagios sice nepouzivam, ale divil bych kdyby neumel zavislosti, zkousel jsi hledat v dokumentaci?
25.3.2013 15:23 KPipa
Rozbalit Rozbalit vše Re: Monitoring a možnosti vyhodnocení stavu

Ano, v dokumentaci jsem hledal.

Způsob řešení závislostí v nagiosu mi ale neumožní odeslat jednu notifikaci pomocí SMS a nekolik na email. Možná se ale mýlím.

 

Jinak Nagios jsem instaloval před dvěma roky, ale až nyní s nárustem sledovaných zařízení a služeb jsem začal počet notifikací řešit.

25.3.2013 15:29 timeos | skóre: 32
Rozbalit Rozbalit vše Re: Monitoring a možnosti vyhodnocení stavu

Podla mna je problem v tom, ze v pripade ked vypadne switch na ktorom je zavislych X zariadeni, tak:

  • Tak sa posle HOST DOWN notifikacia na switch
  • A posle sa X UNREACHABLE notifikacii na nedostupne servery

Ako vieme, su to dve rozdielne notifikacie - ta prva (DOWN) sa tyka priamo overeneho hosta ktory FAIL-lol host-alive check, zatial co ta druha (UNREACHABLE) vznikla ako dosledok prveho FAIL checku na switch a zavislosti, ktore tento switch ma.

Inak povedane staci, ak zrusite UNREACHABLE notifikacie na servery a problem mate odstraneny.

25.3.2013 15:36 KPipa
Rozbalit Rozbalit vše Re: Monitoring a možnosti vyhodnocení stavu

Děkuji za odpověď.

Jít cestou odstranění unreachable u notifikace jsem měl v plánu. http://www.abclinuxu.cz/poradna/linux/show/343760

Ozvu se pokud to dám dohromady.

25.3.2013 16:03 PanZvedavy
Rozbalit Rozbalit vše Re: Monitoring a možnosti vyhodnocení stavu
Odpovědět | | Sbalit | Link | Blokovat | Admin
zabbix to umi
25.3.2013 16:30 j
Rozbalit Rozbalit vše Re: Monitoring a možnosti vyhodnocení stavu
Potvrzuju, zabbix ma (alespon pro me) ponekud privetivensi rozhrani nez nagios a navic umi par peknych veci. Jen je pri sledovani vetsiho mnoztvi HW ponekud ... nenazrany na DB (hromada zapisu => generuje ohromny logy).

Založit nové vláknoNahoru

Tiskni Sdílej: Linkuj Jaggni to Vybrali.sme.sk Google Del.icio.us Facebook

ISSN 1214-1267, (c) 1999-2007 Stickfish s.r.o.