Le wiki

Ce wiki est le point d'entrée de l'ensemble des docs, how-to, tutoriaux rédigés par l'équipe de nagios-fr sur Nagios, la supervision et plus généralement sur la gestion des infrastructures informatiques à partir de logiciels Open Source.

:!: nagios-fr.org héberge désormais le projet de traduction française de la documentation "officielle" de Nagios. Les deux premiers aboutissements sont une version corrigée de la documentation pour Nagios 2.x au format XHTML et PDF.

:!: Pour participer, il suffit de créer un compte sur ce wiki et de se connecter.

Panorama de la supervision opensource

Depuis une dizaine d'années déja, plusieurs projets de supervision ont vu le jour au sein de la communauté du logiciel libre. Il suffit pour cela d'aller faire un petit tour sur sourceforge pour se rendre compte de la multitude de projets émergeants autour de la supervision système et réseau.

Pour le fun, il est même possible de superviser des services depuis Dokuwiki comme le prouve les exemples ci-dessous 8-). Pas de quoi encore se passer de ceux présentés plus bas.

Services testés
(tcp\80)  www @ nagios-fr.org www @ nagios-fr.org
(tcp\80)  www @ yahoo.com www @ yahoo.com

Ces logiciels reposent bien souvent eux-même sur d'autres briques et outils opensource dont voici une compilation.

Une liste plutôt exhaustive existe aussi ici et vous trouverez quelques petites briques intéressantes ici. Une liste intéressante sur les outils de management IT.

Lire la suite...

· %2007/%10/%03 %19:%Oct · Olivier Jan

Nagios

Nagios est un logiciel de supervision destiné à vous informer de problèmes éventuels dans votre système d'informations avant que vos clients, utilisateurs ou managers ne le fassent. Il est prévu pour fonctionner sur système d'exploitation Linux mais fonctionne également sans problème sur la plupart des variantes *NIX. Le démon de supervision effectue des contrôles intermittents sur les hôtes et services que vous spécifiez en utilisant des plugins externes qui retournent un status d'état à Nagios. Quand des problèmes surviennent, il peut envoyer des notifications à des contacts administratifs de façons différentes (email, SMS, messagerie instantanée, etc…). Les informations d'états courants, les historiques et les rapports peuvent être consultés à partir d'un simple navigateur.

Lire la suite...

· %2007/%10/%05 %10:%Oct · Olivier Jan

SNMP

SNMP est un protocole qui permet aux administrateurs réseaux de gérer les équipements et de diagnostiquer les problèmes. SNMP signifie Simple Network Management Protocol et la plupart des switchs, UPS, firewall hardware, routeurs,… comprennent ce protocole pour les diagnostiques.

Remarque : Quand je dit “la plupart”, je parle du matériel que l'on retrouve en entreprise; pas forcément le routeur fourni par votre fournisseur d'accès Internet. Pour savoir si votre matériel est compatible avec le SNMP, veuillez consulter les spécifications techniques livrées avec l'appareil.

Le protocole SNMP est un standard défini par l'IETF dans la RFC 1157 (Mai 1990). Le SNMP est souvent vu comme quelque chose de compliqué et d'assez confus. Les APIs permettant d'interagir avec le protocole englobe tellement de choses qu'au final, on ne s'y retrouve plus. Les livres et la documentation disponibles sur le sujet ont tendance à compliquer les choses et à ne pas les démystifier.

Lire la suite...

· %2008/%02/%01 %12:%Feb · Olivier Jan

Cacti

Cacti est un logiciel de supervision (dit de « capacity planning ») basé sur RRDtool permettant de surveiller l'activité de son architecture informatique à partir de graphiques quotidiens, hebdomadaires, mensuels et annuels.

Cette solution n'est donc pas destinée à alerter en temps réel sur les dysfonctionnements d'un système mais bien de proposer une vision dans le temps de l'évolution d'indicateurs matériels et logiciels (trafic réseau, occupation des disques, temps de réponse, etc…).

Lire la suite...

· %2007/%10/%06 %11:%Oct · Olivier Jan

PNP

PNP est l'acronyme de PNP is NOT Perfparse. Il permet de récupérer la partie performance de la sortie des plugins et d'injecter ces valeurs dans des bases rrdtool puis de les grapher via un front-end écrit en PHP. Il est en cela comparable à d'autres outils comme NagiosGraph, NagiosGrapher, N2RRD voir dans une moindre mesure Cacti.

Lire la suite...

· %2007/%10/%06 %12:%Oct · Olivier Jan

NagVis

NagVis est un addon de visualisation pour Nagios qui permet de générer des vues métier de la supervision.

Lire la suite...

· %2007/%10/%06 %12:%Oct · Olivier Jan

Collectd

Collectd est un démon qui collecte à intervalles réguliers des statistiques sur les performances d'un système et qui offre les mécanismes pour stocker les valeurs récupérées de plusieurs façons, comme par exemple des fichiers RRD.

A mon sens, la grande force de Collectd est qu'il permet d'effectuer du polling de performance à intervalles très court 1) tout en restant très léger sur la jauge cpu de la machine sur laquelle il est installé. Les fichiers RRD générés peuvent être facilement centralisés grâce à un mécanisme client-serveur configurable. C'est le client qui pousse les données au serveur.

Lire la suite...

1) toutes les de 5 secondes si votre machine le supporte
· %2007/%10/%31 %09:%Oct · Olivier Jan

Dstat

Utiliser la versatilité de Dstat pour alimenter en continu un fichier qui sera traité pour mettre à jour des bases rrdtool. Il reste à remonter ses bases rrd vers un serveur Nagios où elles serviront à la fois aux données de performance mais aussi au monitoring gràce à Simple Event Correlator.

Obtenir à terme le meilleur et le plus ouvert possible des clients unix Nagios en remontant des alertes via NSCA. Peut-être que Collectd qui injecte directement les données dans des RRD et qui possède un modèle client serveur semble plus indiqué dans ce rôle ?

Lire la suite...

· %2007/%11/%01 %11:%Nov · Olivier Jan

Monit

Dans la série des clients possibles pour la supervision passive sur Unix, après Dstat et Collectd, voici venir Monit. Celui-ci n'est cependant pas à ranger dans la même catégorie que les deux précédents. En effet, Monit ne renverra jamais de valeurs de performance au serveur Nagios.

Monit est un utilitaire qui permet de gérer et monitorer les processus, les fichiers, les répertoires et les systèmes de fichiers sur sytème Unix. Monit est capable de déclencher des actions de maintenance automatique et peut exécuter des procédures en cas d'erreurs. Par exemple, Monit peut démarrer un processus qui ne l'est pas, redémarrer un processus crashé ou stopper un processus parce qu'il devient trop consommateur de CPU. Vous pouvez utiliser Monit pour monitorer les changements sur les fichiers, les répertoires et les systèmes de fichiers, comme par exemple les changements de timestamps, de checksums, de permissions ou de taille.

Monit est contrôlé par un fichier de configuration facile à maintenir avec une syntaxe orienté token. Monit peut garder trace des évènements dans syslog ou son propre fichier d'historique et notifier qui vous voulez par mail personnalisable. Monit peut exécuter différents contrôles sur le protocole TCP/IP et peut utiliser SSL pour ces contrôles. Monit fournit une interface htpp(s) et vous pouvez donc utiliser un simple navigateur pour accéder à la console.

Dans un setup Nagios, il peut être utiliser pour remplacer les check_proc, check_load, check_files standards en tout genre. C'est l'outil qui semble être le bon parce qu'il n'utilise pas le réseau pour poller les processeurs, fichiers et autres services 1) et surtout il permet une finesse de comportement que non pas les plugins standards. Voyons tout ça par le menu.

FIXME A compléter par des exemples d'envoi de trap snmp vers Nagios.

Lire la suite...

1) il est donc installé sur l'hôte à superviser
· %2008/%01/%30 %14:%Jan · Olivier Jan

Simple Event Correlator (SEC)

SEC est un programme écrit en PERL qui permet de surveiller des fichiers de logs pour y détecter des motifs intéressants en supervision. Il est aussi utilisé pour corréler certains évènements afin de diminuer le nombre de fausses alertes. Il est en ce sens à ranger dans la même catégorie que Swatch.

SEC est un logiciel multiplateforme de corrélations d'évènements Open Source créé pour combler le fossé entre les logiciels commerciaux dédiés à cet usage et les solutions “maison” qui sont souvent quelques scripts shell écrits au fil du temps. SEC accepte les entrées d'un fichier, d'un tube nommé ou de l'entrée standard et peut donc être employer comme couche de corrélation par tous programmes écrivant ses sorties d'évènements dans un flux de fichier. La configuration de SEC est stockée comme règles dans des fichiers texte, chaque règle décrivant l'évènement sur lequel réagir, l'action à mener et optionellement une expression booléenne dont la valeur décide de l'application de la règle à un moment donné. Les expressions régulières, les sous routines Perl, etc peuvent être utilisées pour définir les conditions de l'évènement. SEC peut lui-même produire des évènements en sortie en exécutant des scripts shell ou des programmes externes (snmptrap ou courrier électronique) et/ou en écrivant des messages vers des tubes ou des fichiers.

SEC est utilisé avec succès dans des domaines aussi variés que la gestion des réseaux, le monitoring système, la sécurité des données, la détection d'intrusions, la surveillance et l'analyse de fichiers journaux, etc. SEC est utilisé ou intégré dans des produits aussi différents que HP OpenView NNM et Operations, CiscoWorks, BMC Patrol, Nagios, SNMPTT, Snort IDS, Prelude IDS, etc.

Lire la suite...

· %2008/%04/%06 %15:%Apr · Olivier Jan

Webinject

Webinject est un logiciel libre permettant d'effectuer des tests automatisés de services ou d'applications web. Il peut être utilisé pour tester individuellement les composants d'un système ayant une interface HTTP comme les services JSP, ASP, CGI, PHP, Servlets, HTML Forms, XML/SOAP Web Services… et pour créer des suites complètes de tests de type fonctionnels, regressifs au niveau du protocole HTTP. Une suite de test peut comprendre un ou plusieurs cas de test et permet de les collecter et de les reporter ensemble en une suite logique. Webinject délivre ses résultats en temps réel et peut aussi être utilisé pour mesurer les temps de réponse applicatifs. Il peut bien sûr s'interfacer avec Nagios.

Lire la suite...

· %2008/%04/%08 %13:%Apr · Olivier Jan

Rsyslog

Rsyslog fait partie de la famille des logiciels de journalisation pour Linux à l'instar de Metalog ou Syslog-ng

Rsyslog est un démon de journalisation de type syslogd ayant pour fonctionnalités principales le support de MySQL, syslog/tcp, RFC 3195, les listes d'expéditeurs autorisés, le filtrage sur n'importe quel partie du message et un contrôle très fin du format de sortie. Il est suffisamment compatible avec sysklogd pour être capable de le remplacer complètement. Ses fonctionnalités avancées (notamment les possibilités de cryptage) en font un choix intéressant pour les entreprises tout en restant simple à configurer pour l'utilisateur débutant. Il existe une interface web optionnelle nommée phpLogCon qui permet de voir l'ensemble des données en ligne. En novembre 2007, Rsyslog est devenu le système de journalisation par défaut de la distribution Fedora.

Lire la suite...

· %2008/%04/%15 %09:%Apr · Olivier Jan

Job Scheduler

Job Scheduler est l'une des seules sinon la seule application Open Source que je connaisse qui permette de faire de l'ordonnancement de production informatique. Même si la notion d'ordonnancement peut sembler redondante du fait que Nagios est avant tout un ordonnanceur dédié à la supervision, l'idée est de voir ce qu'apporte logiciel dédié à cette tâche en utilisation avec Nagios, ce mode étant prévu par les concepteurs de Job Scheduler.

Le principe de base de Job Scheduler est d'automatiser l'exécution de tâches simples ou complexes. Son intégration dans Nagios est des plus intéressant. En effet deux utilisations sont envisageables:

  • Vérification qu'une tâche Job Scheduler a bien été effectuée
  • Lancement d'une tâche (job) pour relancer un service, optimiser l'information reçu sur une erreur (diagnostique), etc

Lire la suite...

· %2008/%07/%17 %15:%Jul · Olivier Jan

RRDTool

Cette page est une reprise intégrale de celle de Laurent Coustet. Elle est un point de départ interessant et sera complétée au fur et à mesure.

Lire la suite...

· %2008/%08/%07 %16:%Aug · Olivier Jan
 
start.txt · Dernière modification: 2008/10/12 13:47 par ojan
 

N’hésitez pas à nous contacter et/ou à créer un compte et vous connecter pour corriger toute erreur éventuelle dans ce wiki. Merci.

Recent changes RSS feed Creative Commons License Valid XHTML 1.0 Valid CSS Driven by DokuWiki