Actieve netwerkmonitoring binnen Nagios

In Nagios zijn er globaal twee manieren om de IT infrastructuur te controleren. Als eerste is er de actieve manier. Hierbij voert Nagios zelf controles uit op een systeem. Ten tweede is er de passieve manier. Hierbij ontvangt Nagios een melding van een systeem.

In dit stuk wil ik iets verder ingaan op de actieve manier van monitoren door Nagios.

Nagios maakt gebruik van plugins om een systeem of service van een systeem te controleren. Deze plugin is een kleine script die de controle uitvoert en het resultaat terug geeft aan Nagios. Het script kan doormiddel van SNMP, CIMON, WMI, HTML, XML of andere methodes waarden uitlezen en deze verwerken. Het script geeft dan aan Nagios door, de status, de statusmelding en eventueel performance data.

Om één en ander te verduidelijken gebruik ik het monitoren van de systeem temperatuur van een fysieke server als voorbeeld.

Om besturingssysteem onafhankelijk te monitoren heeft Hewlett Packard (HP) iLO functionaliteit beschikbaar gemaakt op de servers. Naast dat je hiermee op afstand een server kunt beheren met behulp van webbased en XML tools kun je hiermee ook de status uitlezen.

Op dit moment gebruiken wij een script die wordt aangeroepen door Nagios. Nagios geeft als parameter de naam van de server, gebruikersnaam en wachtwoord mee. Het script maakt met deze gegevens verbinding met de iLO-kaart. Hierna wordt er een  XML commando gestuurd waarin wordt gevraagd om alle Health parameters.

Ik weet niet hoe het zit met andere merken servers maar in de Health parameters die wordt geretourneerd zit naast de huidige temperatuur gegevens ook de grenswaarden waaraan de temperatuur gegevens moeten voldoen.

Het script loopt dan door de in XML geretourneerde gegevens en vergelijkt de weergegeven waarde met de grenswaarde. Valt alles binnen de gestelde normen dan wordt als status ‘OK’ geretourneerd aan Nagios. Als statusmelding wordt ‘ILO2 Health OK’ teruggegeven. Tenslotte worden alle temperatuurwaarden als performance data aan Nagios teruggegeven.

De performance data kan worden verwerkt door bijvoorbeeld NagiosGraph om grafieken van de temperatuurverloop te maken.

Mocht er een waarde buiten de grenswaarde vallen dan wordt ‘WARNING’ of ‘CRITICAL’ aan Nagios doorgegeven. De statusmelding wordt ook aangepast in bijvoorbeeld: ‘WARNING: Temperature CPU 2 60C limit 50C’ Hiermee kan een beheerder dan precies zijn wat het probleem is en actie ondernemen.

De plugin/script leest dus de waarden uit en bepaalt aan de hand hiervan de status. Nagios stuurt het script aan en voert aan de hand van de status vervolg acties uit. Bijvoorbeeld het sturen van een SMS naar een beheerder of het uitschakelen van de server.

Geef een reactie

Opgeslagen onder IT Infrastructuur

Geef een reactie

Vul je gegevens in of klik op een icoon om in te loggen.

WordPress.com logo

Je reageert onder je WordPress.com account. Log Out / Bijwerken )

Twitter-afbeelding

Je reageert onder je Twitter account. Log Out / Bijwerken )

Facebook foto

Je reageert onder je Facebook account. Log Out / Bijwerken )

Verbinden met %s