Explication de l'erreur du kernel – Eeeek! page_mapcount est passé négatif

Internet dit que c'est un véritable bogue de kernel mais est-ce que quelqu'un sait ce qui le triggers?

Serveur exécutant CentOS x86_64 avec kernel 2.6.27.24

Voici ma sortie de collision:

[root@u15345757 httpdocs]# Message from syslogd@ at Thu Aug 6 01:42:22 2009 ... u15345757 kernel: [1145736.506380] Eeek! page_mapcount(page) went negative! (-1) Message from syslogd@ at Thu Aug 6 01:42:22 2009 ... u15345757 kernel: [1145736.517515] page pfn = d0a3 Message from syslogd@ at Thu Aug 6 01:42:22 2009 ... u15345757 kernel: [1145736.523814] page->flags = 10000000000083c Message from syslogd@ at Thu Aug 6 01:42:22 2009 ... u15345757 kernel: [1145736.532489] page->count = 2 Message from syslogd@ at Thu Aug 6 01:42:22 2009 ... u15345757 kernel: [1145736.538741] page->mapping = ffff88001f01a110 Message from syslogd@ at Thu Aug 6 01:42:22 2009 ... u15345757 kernel: [1145736.547924] vma->vm_ops = 0x0 Message from syslogd@ at Thu Aug 6 01:42:22 2009 ... u15345757 kernel: [1145736.554543] [ cut here ] Message from syslogd@ at Thu Aug 6 01:42:23 2009 ... u15345757 kernel: [1145736.564528] invalid opcode: 0000 [1] SMP Message from syslogd@ at Thu Aug 6 01:42:23 2009 ... u15345757 kernel: [1145736.564528] Code: 80 e8 22 51 fd ff 48 8b 85 90 00 00 00 48 85 c0 74 19 48 8b 40 20 48 85 c0 74 10 48 8b 70 58 48 c7 c7 10 7f 7d 80 e8 fd 50 fd ff <0f> 0b eb fe 8b 77 18 41 58 5b 5d 83 e6 01 f7 de 83 c6 04 e9 df Broadcast message from root (pts/3) (Thu Aug 6 01:49:29 2009): The system is going down for reboot NOW! 

Ce n'est pas un kernel standard pour CentOS, ce qui signifie qu'il peut y avoir n'importe quel nombre de problèmes. Si vous avez vraiment besoin d'exécuter ce kernel particulier, non standard pour CentOS, je suggère de suivre ce guide

La première chose à faire est d'exécuter memcheck pour éliminer la memory défaillante. Sinon, cela pourrait être un bascule cosmique, ou un véritable bogue du kernel.

Ensuite, cela dépend du stream de travail que vous étiez à ce moment-là (est-ce que la CPU était faim? FS affamé? Etc.) Certains stream de travail sont plus susceptibles de triggersr une RAM défectueuse.