Le matériel réseau devrait-il être réglé sur "autonegotiate" des vitesses ou des vitesses fixes?

Nous avons récemment eu un petit problème avec le réseautage où plusieurs serveurs perdraient de manière intermittente la connectivité réseau de manière assez douloureuse à résoudre (nécessite un redémarrage dur). Cela dure environ deux semaines, apparemment au hasard, sur différents serveurs. Pas de modèle particulier que nous pourrions discerner.

Après avoir creusé, nous avons constaté que le commutateur déclarait 100 Mbps pour le port problem:

Http://blog.stackoverflow.com/wp-content/uploads/switch-autodetect-fail.png

Cela ressemble remarquablement à ce qui s'est passé dans l'article de Joel Spolsky Five Whys

Michael a passé un certain temps à post-mortem, et a découvert que le problème était un simple problème de configuration sur le commutateur. Il existe plusieurs vitesses possibles qu'un interrupteur peut utiliser pour communiquer (10, 100 ou 1000 mégabits / seconde). Vous pouvez soit régler la vitesse manuellement, soit vous pouvez laisser le commutateur négocier automatiquement la vitesse la plus élevée pour laquelle les deux côtés peuvent fonctionner. Le commutateur qui a échoué avait été configuré pour autonégier. Cela fonctionne généralement, mais pas toujours, et le matin du 10 janvier, ce n'était pas le cas.

Nous avons maintenant désactivé la négociation automatique sur notre matériel réseau et l'avons configuré à un débit fixe de 1000 Mbps (gigabit).

Mes questions à ceux qui ont plus d'expertise en réseau de matériel serveur:

  1. Quelle est la fréquence des problèmes de négociation automatique avec le matériel de réseautage moderne?
  2. Est-il considéré comme une bonne pratique de réseautage standard pour désactiver la négociation automatique et définir des vitesses fixes lors de la mise en réseau?

  1. Je n'ai pas encore vu un problème avec la négociation automatique des vitesses de réseau qui n'est pas causé par (a) une incompatibilité du manuel à une extrémité de la liaison et auto sur l'autre ou (b) un composant défaillant du lien ( Câble, port, etc.).

  2. Cela dépend de l'administrateur, mais mon expérience m'a montré que si vous spécifiez manuellement les vitesses des liaisons et les paramètres recto verso, vous ne risquez pas d'être en désaccord avec la vitesse. Pourquoi? Parce qu'il est presque impossible de documenter les différentes connexions entre les commutateurs et les serveurs, puis suivre cette documentation lors des modifications. La plupart des échecs que j'ai vus sont à cause de 1 (a) et vous n'entrez dans cette situation que lorsque vous commencez à définir manuellement les réglages de vitesse / duplex.

Comme mentionné dans la documentation de Cisco :

Si vous désactivez la négociation autonome, elle cache les gouttes de liens et d'autres problèmes de couche physique. Ne désactivez la désorption automatique que pour les terminaux, par exemple les anciennes cartes Gigabit qui ne prennent pas en charge l'autonegociation Gigabit. Ne désactivez pas la négociation automatique entre les commutateurs, à moins d'être absolument nécessaire, car les problèmes de couche physique peuvent ne pas être détectés et entraîner des boucles d'arborescence.

À moins que vous n'êtes prêt à configurer un système de gestion des changements pour les changements de réseau qui nécessite la vérification de la vitesse / du duplex (et n'oubliez pas le contrôle du flux) ou que vous désirez faire face à des décalages occasionnels issus de la spécification manuelle de ces paramètres sur tous les périphériques réseau, Puis maintenez la configuration par défaut de auto / auto.

À l'avenir, envisagez de surveiller les erreurs sur les ports de commutation avec MRTG afin que vous puissiez repérer ces problèmes avant d'avoir un problème.

Edit: Je vois beaucoup de gens qui font référence à des pannes de négociation sur les anciens équipements. Oui, c'était un problème il y a longtemps, lorsque les normes étaient en cours de création et que tous les appareils ne les suivaient pas. Vos NIC et vos commutateurs ont-ils moins de 10 ans? Dans l'affirmative, ce ne sera pas un problème.

  1. Très fréquent, j'ai eu de nombreux problèmes au cours des années avec différents types de matériel.

  2. À mon avis, si l'installation est statique (c'est-à-dire un rack de serveur) et vous ne pensez pas qu'il y aura de modifications, il est judicieux de configurer les vitesses et les duplex de manière manuelle. Tant qu'il est bien documenté afin que les problèmes futurs puissent être évités.

MODIFIER:

Juste pour clarifier, je ne préconise pas d'utiliser des vitesses manuelles sur votre réseau entier, je dirais que 95% du temps auto / auto est le chemin à parcourir. Je dis simplement que j'ai eu des problèmes de duplex / vitesse et que de petites parties de mon réseau (c.-à-d. L'un de nos serveurs) ont principalement des paramètres manuels. Nous exploitons un réseau local hautement contrôlé avec des ports inutilisés arrêtés et des filtres MAC sur la plupart des ports afin de garder une trace des vitesses n'est pas très difficile.

Je crois que si l'autonegociation fonctionnait pendant une heure par jour ou par mois, alors, pour quelque raison que ce soit, "quelque chose arrive" que le réglage du lien vers une vitesse fixe "le corrige", il y a un problème qui n'est pas résolu mais contourné à la place. Je suppose que je vois configurer le lien vers une solution temporaire fixée jusqu'à ce que le problème réel soit corrigé.

Le réseau auquel je suis responsable (avec quelques autres gars) est composé de ~ 40 serveurs, 1000+ postes de travail (répartis sur un assez grand campus) et ~ 1000 WAPs également répartis sur une vaste zone de différents types et âges Des équipements de réseau.

Comme l'a dit dimitri.p, quand quelque chose ne parvient pas à arrêter d'autonegociations, il est habituellement une indication d'un autre problème. Régler manuellement le port est semblable à mettre un bandeid sur quelqu'un qui a été poignardé dans l'intestin – il pourrait arrêter le saignement, mais il y a sûrement des dommages en dessous.

Ma liste de contrôle habituelle:

  • Est-ce que quelque chose a changé sur la machine? Les conducteurs? Paramètres de niveau OS ou BIOS? Peut-être que autoneg était désactivé dans le système d'exploitation?
  • Avez-vous échangé les câbles de raccordement et vérifié les câbles (si c'est un chemin de fer fonctionnant que le rack?)
  • Avez-vous testé pour voir si le port du commutateur est mauvais ou échoué?
  • La NIC pourrait-elle devenir mauvaise?

En règle générale, nous ne désactivons jamais autoneg sur les serveurs (ou tout autre chose dans le centre de données) à moins que ce soit une situation où toutes les autres causes possibles ont été éliminées, nous avons déplacé les ports de commutation, les câbles modifiés, testé la NIC, etc. et il n'y a pas Autre choix. Dans ce cas, il est documenté à mort. Cela arrive très rarement, et habituellement avec des appareils que nous ne pouvons pas avoir accès pour vérifier les paramètres du BIOS et du système d'exploitation.

Les postes de travail et les AP, en revanche, sont une histoire différente. L'authentification erronée est un signe classique d'une mauvaise exécution de câble, et plusieurs fois nous devons configurer manuellement la vitesse et le duplex jusqu'à ce que la saison d'été et la nouvelle saison des câbles dans les parois arrivent.

Ainsi, les étapes de dépannage (supposons que vous arrêtez après chaque et attendez que le problème réapparaît):

  1. Vérifiez les journaux sur le commutateur pour voir s'il vous explique pourquoi il utilise 100M.
  2. Si vous l'exécutez toujours, éteignez cette mauvaise aventure "équilibrée" de Windows que Joel appuie tout le temps – la façon dont il fonctionne est de briser le cache du commutateur, en le forçant à traiter tous les paquets par logiciel. Votre commutateur est conçu pour transférer des paquets dans le matériel et n'a besoin que de la CPU pour déterminer quel chemin physique un flux de trafic inconnu doit prendre (en -> asic -> out) et programmer le matériel pour le faire (lire: a La calculatrice dispose d'une meilleure CPU que votre commutateur, ne faites pas des choses stupides qui rendent la CPU de votre interrupteur plus difficile). L'équilibrage de charge de Windows fonctionne en faisant en sorte que votre commutateur prenne cette décision et réinstalle le cache matériel pour chaque paquet. Cela peut ne pas résoudre ce problème particulier, mais cela me dérange des podcasts … Désolé.
  3. Assurez-vous que la configuration correspond des deux côtés – ça vous ressemble comme vous l'avez fait
  4. Google pour autoneg bugs sur votre commutateur – sauf si vous l'avez construit vous-même, vous n'êtes pas le seul à essayer d'exécuter autoneg sur ce que vous utilisez
  5. Remplacez le câble, avec Cat5e ou mieux – idéalement, un câble que vous connaissez fonctionne, comme celui sur lequel votre station de travail est branché. N'essayez pas d'utiliser Cat5, ou d'une certaine merde, faites-en un qui a des extrémités moulées réelles hors d'un paquet.
  6. Déplacer le port – Mettre le serveur sur un autre port sur le même commutateur
  7. Modifiez la NIC – utilisez un lot différent commandé à un autre moment

À ce stade, vous avez éliminé la configuration, les ports physiques dans lesquels vous êtes branché, le câblage entre eux. Si cela se produit encore , d'autres causes peuvent être:

  1. Routage des câbles – faites attention aux interférences EM de vos câbles d'alimentation secteur, orientez-les sur différents côtés du rack.
  2. Refroidissement – Assurez-vous que la température environnementale n'est pas quelque chose comme 90 degrés et que vos cartes NIC ne sont pas en train d'entrer dans une sorte de "chère Dieu, laissez-moi simplement faire avancer ce mode". J'ai entendu mais je n'ai pas vu que les routeurs de Cisco cessent de faire de la commutation rapide et de transférer des paquets via CPU quand ils surchauffent, par exemple.
  3. Remplacez le commutateur par quelque chose qui ne suce pas – vérifiez la quantité de bande passante que vos hôtes parlent par seconde d'agrégat, puis regardez la capacité de fond de panier nominale de votre commutateur. 7 héberge le potentiel 48, tous transmettant 1.0G suffit pour arrêter un Cisco 3750, par exemple. Soyez également très prudent quant aux vendeurs de réseaux cheapo-and-run: D-Link, Linksys, Dell, Intel et HP. DddMMMMV Trateidence Marco MarcoAdMachea Marco Marco Da Marco Marco Marco Grand Marco MarcoAmaremeaAMMMMMMMLMMLGMMGMMLGGMMMMAAAAAAAAAAAAAAAAAAAAAAYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYY TraoquetMMMMY AlAAAAAA ATeaAAAAAAAAAA A a NEdiceTemea NEAéleaAAAAAAAA a aeaAAAAAAAAAAAAAAAAAAAAAAAguidence Au sujet de la simplicité de Cisco, jusqu'à ce que j'ai utilisé Cisco, à ce moment-là, j'ai cessé d'acheter quelque chose moins ". Cisco est considéré comme un fournisseur de réseau à moyen terme, alors qu'est-ce que cela vous dit des gars en dessous de Cisco …? 🙂

Contexte / pourquoi ma réponse est la plus géniale: je travaille comme ingénieur réseau / systèmes dans l'industrie financière, et voici mon expérience avec notre réseau mondial de petite taille (15 succursales, 8 datacenters):

Tous nos ports LAN sont autoneg, car nous contrôlons l'équipement aux deux extrémités, et nous avons un certain accès aux deux côtés — ce qui peut être aussi simple que d'avoir accès au téléphone à quelqu'un et de les faire vérifier les paramètres. En trois ans, j'ai seulement eu un de nos ports internes échouer en raison de l'échec autoneg, et c'est à cause d'un mauvais câble — il est parti après le remplacement du câble.

Nous avons eu beaucoup plus de problèmes où les prédécesseurs avaient codé 100 / plein sur leurs NIC, et n'ont pas documenté ce fait. Réinitialisez tout à auto / auto à la fenêtre maint suivante et vous n'avez pas eu de problèmes avec eux depuis.

Sur les endroits où nous avons un transfert de cuivre d'un transporteur pour notre WAN? Vous devriez attendre une connexion WAN / WAV en cuivre à tous les temps, en partie parce que vous n'avez aucune idée de ce qui se passe de l'autre côté. Quelques anciens interrupteurs extrêmes qui ont un microprogramme buggy pour autoneg mais le marquage MPLS? Un convertisseur de médias de 5 $ parce que le périphérique de bord de Ciena de 200 000 $ de votre ISP est tout simplement trop génial pour fournir Ethernet sur une paire torsadée? Marco Chamée NEdG Da Marco illustrddM Da MarcoAeaAeaeaeaeaeaeaAeaeaeaeaeaeaeaeaeaeaeaeaeaeaeaeaeaeaeaeaeaeaeaeaeaeaeaeaeaeaeaeaeaeaeaeaeaeaeaeaeaeaeaeaeaeaeaeaeaeaeaeaeaeaeaeaficidenceFeaeaeaeaeaeaeaeaeaeaeaficidenceFeaeaeaeaeaeaeaeaeaeaeaeaeaeaficidenceFeaeaeaeaeaeaeaficidenceFeaeaeaeaeaeaeaeaeaficidenceAeaeaAeaeaeaeaficidenceFeaeaeaeaAeaeaeaeaeaeaeaeaficidenceFeaeaeaAeaeaeaeaeaeaeaficidenceFeaeaAea Daea Daea Da Marco Traea Daea Daea Daea Daea Daeaen Daea Da MarcobeAeaAAAAAATAAAAAAAAAAAAAAA

Sérieusement, obtenez un transfert de fibres de votre FAI.

C'est le mythe du réseau. Nos gars du réseau jurent par ces bêtises, car en 1998, Bay Switch ne négocierait pas avec Cisco ou quelque chose. Marco illustrée Marco MarcoAndMMMMMMMMagesAachdiceAAFMMMMM citeaúdAAAAAAAAuderMemMomb tierrasAFMMMMMMMMMMMMMMMMMMMMMM NEAGAAAAA APORTHELAAAAAAAAAA A CONSLEAECELAAAAAAGMMMONAA AUM A MarcoFONFNMAAAAAA Trage MarcoAAAAFMombea MarcoAusseaAFMachea RecepusAFMMMMMomb RecepyddMMMMAAAAAAAAAAAAA A TraurugenetasAlddddeterdeterAAAAAAAAAAAA A CONSEReacoAlemeaAeaA Recepea MarcoAAAAAAAAA A Traea Marco

Dddidence Marco Da MarcoAeaFeaMFMachea Da MarcoHeaMMMMM AccouFddMMMTdiceAufddMMMTT comprisAusseaeaeaeaeaeaeaeaeaeaeaeaeaeaeaeaeaeaeaeaeaeaeaeaeaeaficfeeaeaeaeaeaeaeaeaeaeaeaficidence DaeaeaeaeaeaeaficeaeaAeaAeaeaeaeaficeAeaAeaeaeaficeAseeaeaeaeaAdiceeaficidenceAeaeaAeaeaeaAfichandoAeaeaeaeaeaA MarcoAndeaeaeaeaeaA MarcoAea MarcoAvidaseaeaeaanA MarcoAea Marco Dafeea Da Marco DafefeúeaAAAAAAAAAAAAA Marco MarcovaAAAAAAAAoca Marco MarcoAndMelugaiajoyeaeaeaeaficea Da Marco Daea Da Marco Marco Dafefeúea (Les pilotes aspirent toujours)

En défense des gars du réseau, beaucoup de sévers fonctionnent avec les pilotes NIC par défaut de Windows, qui sont généralement suck. Si vous avez des problèmes avec autonegotiate, et que votre équipement ne date pas de l'administration Clinton, mettez à jour ces pilotes NIC.

Vous devriez négocier automatiquement. Si vous avez un commutateur qui ne négociera pas automatiquement, achetez un meilleur changement.

Gigabit est supposé négocier automatiquement, et cela inclut la détection automatique de crossover (MDI-X).

100baseT est garanti pour échouer si une extrémité est réglée sur auto et l'autre réglé sur manuel, et c'est selon les spécifications. Si vous forcez une extrémité à 100 / plein, l'autre extrémité négociera automatiquement à 100 / demi, vous donnant une incompatibilité de duplex.

En règle générale, je configure les serveurs à réparer car j'ai vu le matériel réseau négocier à 10 / demi au lieu de 1000 / plein.

De plus, certains CoLos ont configuré leurs commutateurs pour ne pas négocier, mais seulement pour créer un lien à 1000 / plein.

La désactivation de la négociation automatique dans une configuration initiale non testée est semblable à la programmation voodoo: vous changez quelque chose sans raison valable. Si, après avoir testé, vous voyez qu'il y a un incompatibilité de duplex ou de vitesse ou qu'il y a des erreurs excessives sur le port, puis engagez-vous d'autres dépannage et finalement réparez la configuration si nécessaire.

Lorsque vous mettez à niveau un pilote ou que vous remplacez du matériel, il n'y a aucune garantie que vos paramètres seront conservés du côté du serveur.

Définissez les deux côtés du lien pour négocier, ou réparez les deux côtés. Lorsque vous corrigez la vitesse et les paramètres recto verso sur certains appareils, ils n'annoncent plus leurs capacités à leurs concurrents. Je ne sais pas ce que la norme Ethernet dit sur ce qu'il faut faire lorsqu'un interlocuteur annonce des capacités et que l'autre partie ne l'est pas, et cela signifie probablement que beaucoup d'implémenteurs ne le savent pas non plus. Certains choisiront le plus petit dénominateur commun, qui est de 10 et les autres vont supposer que tout va bien et choisir la vitesse la plus rapide possible.

Il existe des pièces de rechange contemporaines qui ne supportent pas la négociation automatique sur Gigabit Ethernet en cuivre, comme (au moins certains) commutateurs Cisco avec SFP en cuivre.

Il y a de nombreuses années, j'ai passé du temps à travailler pour que 3com fasse un support technique pour pratiquement toutes ses activités de réseautage. Il est incroyable de voir à quelle fréquence ce problème est apparu, et c'est plutôt une procédure standard pour tout régler manuellement.

Rough one. J'ai vu des NIC de 3Mb 3com qui ne se connecteraient pas au-dessus de 10Mb si vous avez forcé la vitesse ou le duplex. Vous ne pourriez obtenir une vitesse maximale en les autorisant à négocier automatiquement même si le pilote disposait de 100Mb Full et de 100Mb Half settings.

De nombreux pilotes NIC ne vous permettent pas de spécifier 1000Mb. Les seuls choix sont 10, 100, Auto. Encore une fois, vous obliger à faire Auto si vous voulez une vitesse maximale. Par exemple, le pilote Broadcom NetXtreme 57xx Gigabit se comporte de cette façon.

Vous pouvez facilement forcer Gigabit sur le commutateur, mais je pense que vous devrez obliger la plupart des NIC à négocier automatiquement.

  1. Dans mon expérience (principalement les équipements 3Com et HP, pas beaucoup de Cisco), l'auto-négociation ne pose pas beaucoup de problèmes.

  2. De la même manière que mrdenny, je configurerai généralement les serveurs à leur vitesse la plus rapide (nous en avons encore une à 100), full duplex, puis laissez l'auto sur. Étant donné que nous avons un mélange de vitesses sur les serveurs et les postes de travail, je préfère beaucoup laisser les commutateurs à l'automatique et les laisser s'adapter au point de terminaison.

J'ai eu beaucoup de problèmes avec la négociation automatique. Beaucoup, bien sûr, cela signifie un tous les quelques mois, mais c'est un problème trop important dans mon livre.

Les problèmes de négociation automatique sont difficiles à trouver, en particulier lorsque les personnes qui utilisent le réseau, les serveurs, les applications et les bases de données sont quatre équipes différentes. Habituellement, les deux derniers passent beaucoup de temps à aller et venir, s'accordant de mauvaises performances et de mensonges sur les mesures, et parfois le donner un coup de pied aux personnes du serveur, qui examineront correctement la sortie de "top" et disent tout Bien avec le serveur.

Cela se poursuit jusqu'à ce que la question s'élève au point où un «expert» (en fait, quelqu'un qui est un généraliste, et qui comprend ainsi les réseaux, le matériel, les systèmes d'exploitation, les bases de données, les cadres et les applications) est affecté au problème et trouve le problème Dans les cinq ou dix minutes.

Donc, ma propre règle de base, chaque fois que j'ai la capacité de faire quelque chose à ce sujet, c'est TOUJOURS fixer des vitesses fixes sur les serveurs de production, les commutateurs et les routeurs. Les serveurs non productifs, s'ils sont suffisamment séparés pour les personnes qui l'utilisent, ne disposent pas d'accès root.

Les commutateurs utilisant l'accès au bureau / ordinateur portable peuvent être laissés à négocier automatiquement, et il existe des exceptions à la règle. Juste pour en mentionner un, s'il y a beaucoup de changements dans le réseau, il vaut mieux le laisser en voiture et surveiller les choses.

Un autre point qui peut être utile, quel que soit le choix que vous prenez concernant l'auto-négociation , est de surveiller la chose. Configurez simplement Nagios ou qu'est-ce que vous avez à surveiller l'état de tout port important. Vous êtes déjà en train de surveiller ces équipements de réseau, n'est-ce pas?

J'ai eu quelques problèmes avec autonegotiation dans une installation de la maison et le problème était le câblage, en particulier les câbles de réseau enroulés dans une boucle avec un diamètre trop petit ou le mettre trop près des câbles d'alimentation.

Mais je pense que ces suggestions sont un peu trop banales pour votre configuration. 😉

J'ai récemment lu à propos de cela dans Network Warrior par Gary Donahue. Sur la base de ce livre pour la négociation automatique pour fonctionner correctement, l'interrupteur et la NIC doivent être configurés pour la négociation automatique. Le réglage de la NIC à une vitesse spécifique et au mode duplex et à la sortie du serveur lors de la négociation automatique ne fonctionnera pas correctement. La négociation automatique est un protocole et les deux parties doivent parler pour que les paramètres fonctionnent correctement.

Si vous souhaitez régler explicitement la vitesse et le mode duplex, vous devez le faire aux deux extrémités de la connexion.

Cisco discute de certains cas où vous souhaitez configurer manuellement la vitesse du port et le duplex plutôt que d'utiliser autonegotiate, lors de l'utilisation des périphériques de sécurité PIX / ASA: http://www.cisco.com/fr/US/products/hw/vpndevc/ps2030/ Products_tech_note09186a008009491c.shtml # dépannage

Ma règle principale est d'utiliser la négociation automatique pour tout sauf les liens de routeur, sauf si vous avez spécifiquement un problème (comme les cartes Broadcom récentes … BAH!)

Si vous avez deux routeurs reliés par ethernet par exemple, réglez manuellement la vitesse aux deux extrémités.