Systém Nagios je Open Source monitorovací nástroj, který je možno využít pro dohledování infrastruktury (např. servery, směrovače, switche, tiskárny...) a služeb jimi poskytovaných. Do systému je možné integrovat také externí monitorovací systémy, např. programy k UPS.
Architektura:
Hlavní částí Nagiosu je démon nagios. Tento démon po spuštění načte z konfiguračních souborů nastavení a začne monitorovat. Informace o výsledcích test u ukládá do souboru, z jiného souboru zase načítá příkazy. Pro zobrazení informací o stavu slouží webové rozhraní, které je realizováno několika CGI skripty. Tyto CGI skripty přistupují do souboru se stavy a zobrazují jej v rozumné formě jako HTML stránky.
Pro přístup k Nagiosu můžeme použít HTML prohlížeč. Z webového rozhraní je možné do Nagiosu zasílat i jednodušší příkazy. Nevyhovuje-li koncovému uživateli z jakéhokoliv důvodu webové rozhraní, je možné webové rozhraní přizpůsobit (nacházíme se ve světě Open Source Software) nebo napsat celé prezentační rozhraní znovu. Celý systém je navržen velmi logicky a pochopitelně.
Konfigurace:
Zařízení a služby
Základní konfigurace démona je jednoduchá, umožňuje dohledovat zařízení ICT a na nich dostupné služby. Příkladem zařízení může být zatížení procesoru, obsazení disku, využití paměti, teplota procesoru, trafic na sít'ovém rozhraní, apod. Pro každou službu je definován způsob, jak otestovat její funkčnost (stáhneme WWW stránku, pošleme počítač požadavek na odezvu, zjistíme zatížení procesoru, apod.). Realizace testu je programem realizovaná pomocí tzv. plug-in, což jsou malé jednoúčelové programy, které testují podle zadaných parametrů službu a výsledek předávají do hlavního démona. Plug-in do hlavního démona předává stavy OK/WARNING/CRITICAL. V případě, kdy stav služby na testovaném zařízení není OK otestuje démon navíc stav zařízení. I pro testování stavu zařízení se používá plug-in, zařízení se na rozdíl od služby může nacházet pouze ve stavech UP a DOWN. Navíc Nagios označí stavem UNREACHABLE zařízení, která test vyhodnotí jako DOWN a nejsou dostupná. Zařízení je možné spojovat do logických skupin, které při grafickém zobrazení zpřehledňují zobrazení, typicky se používají skupiny podle činnosti nebo architektury zařízení, např. síťové prvky, linuxové servery, apod. Pro každé zařízení je možné definovat, které zařízení je nadřazené . V případě nedostupnosti nadřízeného zařízení jsou zařízení za ním prohlášena za UNREACHABLE.
Akce
Pro každé zařízení je možné definovat akce, které se mají provést v případě, kdy zařízení změní stav (z UP na DOWN či naopak), podobně i pro změny stavu služeb. Typickou akcí je zaslání mailu správci patřičného stroje nebo služby. Nagios však není omezen pouze na odesílání mailů. Stejně jako pro testování, i pro akce je možné použít plug-iny a do systému vložit vlastní funkcionalitu . Odeslání SMS, odeslání Instant Messaging zprávy, provedení příkazu, uložení výpisu souboru na disk.
Akce je možné nastavit s různou pravidelností (v různých intervalech), a mohou chodit různým osobám.
Kontakty a skupiny
Pro zasílání informací o nedostupnosti je potřeba udržovat v konfiguraci seznam e-mailových adres, které se udržují v kontaktech.
Kontakty je možné sdružovat do skupin, typicky jedna skupina obsahuje odborníky na danou problematiky.
Období
Pro zjednodušení konfigurace se používá koncept období. Je možné definovat vlastní období:
Pasivní testy
Popisované testy jsou aktivní testy podle toho, že démon nagios je provádí přímo ve vlastní režii. Kromě toho lze do Nagiosu integrovat i jiné zprávy, provádí se pomocí tzv. pasivních testů. Pasivní testy se zobrazují v rozhraní Nagiosu jako normální testy, rozdíl je pouze v tom, že Nagios nežádá o provedení testu, ale výsledky přichází z externího zdroje. Jako pasivní testy se integrují typicky SNMP trapy.
Máte-li zájem o bližší informace, neváhejte nás kontaktovat -
sales@komix.cz
.