Surveillance «Application» de Zabbix – Comment détecter une application gelée «suspendue»?

J'ai un server Zabbix sur Ubuntu en cours de travail … J'ai installé un agent sur mon server Windows. Template_Windows fait des merveilles et me donne toutes sortes de statistics avec lesquelles je suis heureux de jouer …

Le problème, c'est que j'essaie de surveiller une application. Pas un service ou un site web. Une application.

J'ai une application qui aime se briser de façon inattendue. J'aimerais pouvoir get une alerte "Programme ne répond pas" (et ensuite entonnoir cela dans un email / sms / rapports).

J'ai un autre server avec une application que je voudrais surveiller les statistics (utilisation du processeur, etc.).

Je vois comment surveiller les services … mais ce ne sont pas des services. Ce sont des applications qui s'exécutent alors qu'un «Utilisateur» est connecté. Je ne peux pas find un bon tutoriel sur la façon de configurer quelque chose comme ça.

Modifier: faire d'autres searchs et bricoler … La question devient: sans tenir count de la méthode, comment puis-je détecter qu'une application est gelée / accrochée / ne répond pas?

  • Utilisez Proc_Counter et détectez s'il n'y a pas d'activité zéro pour … 15 secondes?
  • Utilisez une mésortingque perf_info? Je ne semble rien voir qui indiquerait un process accroché, mais la seule page de manneque que je peux find est 1.4 et Zabbix actuel est 1.8.4.
  • VBScript, test de command line, etc. qui surveillent / testez l'application avec une sortie qui peut être suivie via UserParameters?

Je ne peux pas avoir l'air de travailler. Une fois que je peux vérifier un process accroché, je peux répondre avec kill-kill / start-up, e-mail responsable party, etc … mais je ne peux pas find un moyen gracieux de détecter un process / application accroché.

Il m'a fallu toujours simple-checks travailler. Je n'ai pas encore essayé d'applications.

Est-ce que la deuxième publication ici aide? http://www.zabbix.com/forum/showthread.php?t=18206

Vous pouvez aller dans plusieurs directions.

Probablement les deux plus faciles seraient de build un paramètre user qui exécute un script sur le système client pour vérifier la santé de votre application. Si cela prend plus de 30 secondes pour fonctionner, il vous sera probablement mieux servi en configurant un script qui poussera datatables de santé vers Zabbix à l'aide du zabbix-sender. À l'autre extrémité, vous pouvez faire un certain nombre de choses, probablement l'un des plus faciles à triggersr sur nodata () et une combinaison de last () = errorvalue. La vérification de nodata fonctionne mieux si vous utilisez cron en envoyant datatables car le chronométrage du contrôle n'est pas contrôlé par Zabbix.

Il y a eu plusieurs discussions à ce sujet dans le forum Zabbix.

http://www.zabbix.com/forum