Virtualized Windows 2008 R2 jette du BSOD random, mais n'écrit pas de miniduries

nous rencontrons des BSOD randoms à l'intérieur d'un server RemoteDesktop hébergé par VMware. Les BSOD se produisent presque chaque semaine. Une chose curieuse est que la machine virtuelle n'écrit pas de décharges que nous pourrions parsingr, pas de miniduteries en% systemroot% \ minidump et aucune décharge complète. Le seul indice que le server nous donne est une input dans son journal d'events, affirmant qu'il fallait redémarrer en raison d'une erreur critique. Les détails de cette input de journal montrent un BugCheckCode 252 / 0xFC, qui est ATTEMPTED_EXECUTE_OF_NOEXECUTE_MEMORY .

Les problèmes de MSDN pour parsingr les décharges et searchr le pilote de défaut stocké dans KiBugCheckDriver . Comme il n'y a pas de décharges écrites, nous n'avons évidemment pas cette option disponible.

Le server de pannes est un Windows 2008 R2 hébergé sur VMware ESXi 5.5.0. Les rôles installés et configurés sont RemoteDesktopServer, FileServer, Print et Webserver. D'autres machines virtuelles fonctionnant sur le même hôte ne semblent pas être affectées par ce problème.

Voici la sortie que nous obtenons sur les détails des events:

BugcheckCode 252 BugcheckParameter1 0xfffff88001e64fb8 BugcheckParameter2 0x800000000293e963 BugcheckParameter3 0xfffff88015c55eb0 BugcheckParameter4 0x2 SleepInProgress false PowerButtonTimestamp 0 

Ce que nous avons essayé jusqu'à présent:

  • Désactivé le redémarrage automatique dans les parameters du système. Nous ne pouvons le faire qu'après l'arrivée de nos clients, car c'est l'un des servers les plus productifs avec lesquels ils travaillent. Nous avons désactivé le redémarrage automatique pour tous les scénarios de tests suivants:
    • Nous avons bloqué la machine virtuelle à dessein, en utilisant NotMyFault à partir de Sysinternals: les BSOD sont arrivés et nous semblaient plutôt "normaux" pour nous. BSOD a déclaré qu'il était terminé de décharger des informations sur le disque, mais comme dans les BSOD au hasard, nos clients ont l'expérience, il n'y avait absolument aucune décharge écrite
    • Nous avons essayé de définir la taille de pagefile.sys manuellement à différentes tailles (jusqu'à 2 fois la RAM), les mêmes résultats

Certaines des inputs EventLog ne semblent pas avoir d'informations précieuses:

 BugCheckCode 0 BugcheckParameter1 0x0 BugcheckParameter2 0x0 BugcheckParameter3 0x0 BugcheckParameter4 0x0 SleepInProgress false PowerButtonTimestamp 0 

Longue histoire courte, la question principale serait pourquoi il n'y a absolument aucune décharge écrite sur le disque. L'parsing du BSOD / dump lui-même devrait être l'approche la plus orientée vers cette erreur.

Si je peux fournir plus d'informations ou oublié quelque chose, requestz simplement 🙂

Si vous utilisez les CPU Intel E5, consultez cet article KB: http://kb.vmware.com/kb/2073791

Symptômes

Lors de l'exécution d'une machine virtuelle avec Windows 2008 R2, Red Hat Enterprise Linux ou Solaris 10 64 bits, vous pouvez rencontrer l'un de ces symptômes: • Événements de l'écran bleu Windows 2008 R2:

0x0000000a – IRQL_NOT_LESS_OR_EQUAL 0x0000001a – MEMORY_MANAGEMENT 0x000000fc – ATTEMPTED_EXECUTE_OF_NOEXECUTE_MEMORY

Cause

Au moment de la publication (10 septembre 2014), ces processeurs sont identifiés comme étant affectés: • Processeurs nommés Processeur Intel® Xeon® E5 – #### v2, où #### est un numéro à 4 numbers, éventuellement suivi d'une lettre. • Processeurs appelés processeur Intel® Xeon® E7 – #### v2, où #### est un numéro à 4 numbers. • Processeurs appelés Processeur Intel® Xeon® E3-12 ## v2, où ## est un numéro à 2 numbers suivi d'une lettre.

Résolution

C'est un problème connu qui affecte VMware ESXi. Contactez votre fournisseur pour un BIOS mis à jour pour votre matériel pour résoudre ce problème et faites reference aux Errata Intel correspondantes: • CA135 – Un MOV à CR3 Lorsque EPT est activé peut entraîner une erreur de page inattendue ou une traduction incorrecte de la page dans la section Errata du document Intel® Xeon Processor E5 v2 Product Family. • CF124 – Traduction incorrecte de la page lorsque EPT est activé dans la section Errata du document Intel® Xeon Processor E7 v2 Product Family.

Remarque: Les liens précédents étaient corrects à countr du 11 juillet 2014. Si vous trouvez qu'un lien est brisé, donnez votre avis et un employé de VMware mettra à jour le lien.

S'il n'y a pas de mise à jour du BIOS disponible pour votre plate-forme, utilisez l'une des options suivantes pour résoudre ce problème:

Mises à niveau: ce problème est résolu dans ESXi 5.5 Update 2, disponible dans VMware Downloads. Pour plus d'informations, consultez les mises à jour VMware ESXi 5.5 Update 2.

Actuellement, il n'y a pas de résolution pour les hôtes ESXi 5.1.

Si vous utilisez ces CPU, je vous suggère de mettre à niveau le BIOS de vos hôtes ou de mettre à niveau ESXi vers la version 5.5 Update 2.