Monitoring sítě a serverů

Software pro monitoring firemní sítě a serverů

Tento článek vznikl jako první díl pro sekci monitoring firemních sítí. Je v něm uveden software, kterého je společnost Solutia, s.r.o. partnerem a v dalších dílech tohoto vlákna blogu bude rozebrán do větších detailů. Tento díl je pouze obecné overview k produktu.

Pokud hledáte centrální systém pro monitorování zdrojů firemní sítě (např. metrik serverů, rychlosti a dostupnosti sítě, rychlost provádění SQL dotazů, rychlost portů aktivních prvků apod.), nebo chcete znát SLA pro jednotlivé služby ve vaší správě (jak dlouho je služba nedostupná), jedna z možností, která je k dispozici je software Nagios.

Společnost Nagios nabízí produkt, který je zcela zdarma. Lze jej využít na neomezený počet monitorovaných zařízení. Má vlastní webovou konzoli a veškeré komponenty, které jsou pro monitoring zapotřebí (pluginy pro různé operační systémy, systém pro notifikace, možnost administrace uživatelů). Tímto nástrojem je Nagios Core. Nagios umožňuje různé druhy monitorovacích rozhraní jako je SNMP, WMI, agenty pro Windows i Linux/Unix, SMPT, POP3, monitoring otevřených portů, odezvu webové stránky, platnosti certifikátů apod.

Systém Nagios Core je možno spravovat a nastavovat pouze úpravou konfiguračního souboru, přes příkazovou řádku serveru. Pro jednotlivý monitoring zařízení, nebo služeb je zapotřebí vytvořit soubor, který bude specifikovat hodnoty, které se mají při monitorování používat. Každé zařízení musí mít svůj konfigurační soubor, ve kterém se definují hodnoty, jako je IP adresa, název, frekvence kontrol a notifikací a v neposlední řadě plugin, kterým se bude zařízení monitorovat. Na zařízení (hostu) se pak mohou textově definovat služby, které se mají monitorovat (využití CPU, RAM, zaplnění disku apod.).

define host {

    host_name                       bogus-router

    alias                           Bogus Router #1
    address                         192.168.1.254
    parents                         server-backbone
    check_command                   check-host-alive
    check_interval                  5
    retry_interval                  1
    max_check_attempts              5
    check_period                    24x7
    process_perf_data               0
    retain_nonstatus_information    0
    contact_groups                  router-admins
    notification_interval           30
    notification_period             24x7
    notification_options            d,u,r
}

Příklad pro definování monitorovaného zařízení (hosta):

Výše uvedená tabulka do monitoringu přidá zařízení jménem bogus-router, IP adresou 192.168.1.254, nadřazeným zařízením (parentem) server-backbone a zařízení bude monitorováno pomocí pluginu check-host-alive, každých 5 minut 24h denně 7dní v týdnu. Notifikace budou chodit na skupinu uživatelů ze skupiny router-admins 24×7 v intervalu 30min při nedostupnosti (u) a vypnutí (d) zařízení stejně tak, jako při jeho náběhu (r).

Úprava každého parametru monitoringu musí proběhnout manuálně, přepsáním konfiguračního souboru, na souborovém systému serveru. Ulehčením je v tomto případě využití templates. V případě použití templates si lze manuální práci ulehčit tím, že se vytvoří vzorové zařízení s monitorovanými službami a poté jej pouze u nových zařízení znovu využívat se stejnými hodnotami.

S přihlédnutím ke zmíněnému popisu nastavení se Nagios Core hodí spíš pro malé až střední sítě s malým množstvím monitorovaných zařízení. Pro větší, enterprise, prostředí tato varianta není vhodná kvůli časové náročnosti nastavení. Pro tento typ prostředí nabízí Nagios verzi Nagios XI. XI je monitorovací nástroj, postavený na Nagios Core, nabízí stejné možnosti monitoringu, ale navíc obsahuje plnohodnotné webové rozhraní s možností plného nastavení v uživatelsky přívětivém, intuitivním prostředí. Tato verze v základu obsahuje i wizardy, pro nastavení monitoringu zařízení s veškerými jeho službami. Pro administrátora je pak jednoduché vybrat pouze typ zařízení, nebo Operační Systém, IP adresu a Nagios XI se postará o vše ostatní – zjistí spuštěné služby, jména a rychlosti portů, velikost a pojmenování disků. Navrhne nejlepší intervaly monitorování, notifikační skupiny a parenta pro dané zařízení. Administrátor tedy nemusí nic nastavovat pomocí konfiguračních souborů v OS serveru, ale vše je provedeno pomocí webového rozhraní.

Ve skutečnosti je webové rozhraní Nagios XI pouze přehledný prostředník pro administrátora, který nastaví hodnoty v konfiguračních souborech na disku serveru. Tím pádem není monitorující pracovník ochuzen ani o možnost nastavení drobných nuancí monitoringu přes soubory. Na obrázku níže je příklad nastavení stejného zařízení (bogus-router) přes Nagios XI.

V dalším díle blogu se budu do hloubky zabývat Nagios Core. Jeho instalací a nastavením.

Autor: Jan Szala