Le site Web tombe pour moi. Comment dois-je diagnostiquer (quels files journaux vérifier?) (Nginx + php5-fpm)

Résumé

J'ai parcouru un site Web sur un VPS et j'ai rencontré mon premier time d'arrêt (~ 4 minutes). Cependant, le site Web n'était que faible pour moi et je ne vois rien dans les files journaux évidents. Où devrais-je regarder?

Il n'y a aucune input dans php5-fpm.log pour l'heure ou 20 minutes de chaque côté. Il n'y a rien dans le journal des erreurs.

Les seules inputs dans le journal d'access nginx sont pour le "Est-ce pour tout le monde ou juste pour moi service".

Où d'autre devrais-je regarder?

Détaillé

Serveur: Ubuntu 12.04, LEMP Stack

J'avais l'erreur: "Ce site web n'est pas disponible". Cependant, d'après d'autres vérificateurs de ping, le site Web n'était que faible pour moi (ma maison, plusieurs ordinateurs dans ma maison ne fonctionnaient pas). D'autres sites fonctionnaient bien.

Ce n'est que quelques minutes que je n'ai pas eu le time d'essayer d'essayer. J'ai vérifié avec mon fournisseur de domaine et ils ont dit qu'ils n'avaient pas de time d'arrêt.

Journal d'access Nginx:

(Advagg est un module drupal qui agrège les files css et js. Si cela échoue, le site devrait apparaître sans style).

127.0.0.1 - - [06/Mar/2014:22:24:20 +0000] "GET /authcache-varnish-get-key HTTP/1.1" 302 46 "http://www.downforeveryoneorjustme.com/mysite.net" "Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/33.0.1750.146 Safari/537.36" 127.0.0.1 - - [06/Mar/2014:22:24:21 +0000] "GET / HTTP/1.1" 302 46 "http://www.downforeveryoneorjustme.com/mysite.net" "Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/33.0.1750.146 Safari/537.36" 127.0.0.1 - - [06/Mar/2014:22:24:38 +0000] "GET /sites/default/files/advagg_css/css__1394144677.css HTTP/1.1" 404 325 "-" "Drupal (+http://drupal.org/)" 127.0.0.1 - - [06/Mar/2014:22:24:39 +0000] "GET /sites/default/files/advagg_js/js__1394144677.js HTTP/1.1" 404 325 "-" "Drupal (+http://drupal.org/)" 127.0.0.1 - - [06/Mar/2014:22:25:00 +0000] "GET /sites/default/files/advagg_css/css__1394144700.css HTTP/1.1" 404 325 "-" "Drupal (+http://drupal.org/)" 127.0.0.1 - - [06/Mar/2014:22:25:01 +0000] "GET /sites/default/files/advagg_js/js__1394144700.js HTTP/1.1" 404 325 "-" "Drupal (+http://drupal.org/)" 

Vous ne pouvez probablement pas découvrir ce qui s'est passé à less que vous ayez (ou puissent) des stream Netflow ou équivalents et que vous les traversiez (et même alors, c'est beaucoup de travail)

Généralement, la meilleure façon de gérer ce genre de chose est d'avoir un suivi et d'être armé de connaissances et les outils pour le vérifier pendant qu'il se passe. Un outil simple que vous devez installer à peu près n'importe quel système en tant qu'administrateur réseau est «mtr» (ou un équivalent Windows ou Android). Ceci combine traceroute et ping et montre où les problèmes de réseau s'infilternt.

Un autre outil (mais plus de travail / $$) est de configurer (ou acheter) la surveillance de vos systèmes, par exemple en utilisant Nagios et Cacti à partir d'un système distant.

Bien qu'il soit impossible de savoir ce qui a causé votre panne, parmi les causes les plus susceptibles sont

  1. Votre connection DSL ou équivalent déconnecté et reconnecté ou

  2. Il y avait un routing anormal et un routeur a baissé, donc vous avez perdu la connectivité alors que BGP a été reconverti [c.-à-d. Trouvé anothe path]. Cela pourrait s'être coincé entre vous et votre server.