Quel disque est mauvais dans RAID6

Serveur: Ubuntu Lucid
Contrôleur RAID: Adaptec 3805
8 disques dans RAID6 sur HP Proliant DL180 G5 Matériel

Mon kern.log me dit que j'ai une erreur sur sdb, comme indiqué ci-dessous:

[2740390.344436] sd 4:0:1:0: [sdb] Result: hostbyte=DID_OK driverbyte=DRIVER_SENSE [2740390.344439] sd 4:0:1:0: [sdb] Sense Key : Hardware Error [current] [2740390.344442] sd 4:0:1:0: [sdb] Add. Sense: Internal target failure [2740390.344447] sd 4:0:1:0: [sdb] CDB: Read(10): 28 00 33 dd dc 00 00 00 08 00 [2740390.344454] end_request: I/O error, dev sdb, sector 870177792 [2774094.573841] sd 4:0:1:0: [sdb] Unhandled sense code [2774094.573847] sd 4:0:1:0: [sdb] Result: hostbyte=DID_OK driverbyte=DRIVER_SENSE [2774094.573851] sd 4:0:1:0: [sdb] Sense Key : Hardware Error [current] [2774094.573856] sd 4:0:1:0: [sdb] Add. Sense: Internal target failure [2774094.573862] sd 4:0:1:0: [sdb] CDB: Read(16): 88 00 00 00 00 01 33 dd ef e8 00 00 01 00 00 00 [2774094.573873] end_request: I/O error, dev sdb, sector 5165150184 [2774094.615437] sd 4:0:1:0: [sdb] Unhandled sense code 

La command arcconf me dit que tous les états du disque sont en ligne et les rayures échouées: Oui

Comment puis-je identifier quel disque est incorrect sur le réseau 8 disk raid6?

Modifié: le 2 mai 2012 – ajouté ci-dessous:

/ usr / local / sbin / arcconf getconfig 1 AL

 Controllers found: 1 ---------------------------------------------------------------------- Controller information ---------------------------------------------------------------------- Controller Status : Optimal Channel description : SAS/SATA Controller Model : Adaptec 3805 Controller Serial Number : 0C18115C3BB Temperature : 0 C/ 32 F (Normal) Installed memory : 128 MB Copyback : Disabled Background consistency check : Disabled Automatic Failover : Enabled Global task priority : High Stayawake period : Disabled Spinup limit internal drives : 0 Spinup limit external drives : 0 Defunct disk drive count : 0 Logical devices/Failed/Degraded : 2/0/0 NCQ status : Enabled -------------------------------------------------------- Controller Version Information -------------------------------------------------------- BIOS : 5.2-0 (17342) Firmware : 5.2-0 (17342) Driver : 1.1-5 (2461) Boot Flash : 5.2-0 (17342) -------------------------------------------------------- Controller Battery Information -------------------------------------------------------- Status : Optimal Over temperature : No Capacity remaining : 99 percent Time remaining (at current draw) : 3 days, 1 hours, 11 minutes ---------------------------------------------------------------------- Logical device information ---------------------------------------------------------------------- Logical device number 0 Logical device name : boot RAID level : 1 Status of logical device : Optimal Size : 476150 MB Read-cache mode : Enabled Write-cache mode : Enabled (write-back) Write-cache setting : Enabled (write-back) Partitioned : Yes Protected by Hot-Spare : No Bootable : Yes Failed ssortingpes : No Power settings : Disabled -------------------------------------------------------- Logical device segment information -------------------------------------------------------- Segment 0 : Present (0,7) Z2AD1A3H Segment 1 : Present (0,3) Z2AD1834 Logical device number 1 Logical device name : data RAID level : 6 Reed-Solomon Status of logical device : Optimal Size : 2858990 MB Ssortingpe-unit size : 128 KB Read-cache mode : Enabled Write-cache mode : Enabled (write-back) Write-cache setting : Enabled (write-back) Partitioned : Yes Protected by Hot-Spare : No Bootable : No Failed ssortingpes : Yes Power settings : Disabled -------------------------------------------------------- Logical device segment information -------------------------------------------------------- Segment 0 : Present (0,0) 6VPEFSZ0 Segment 1 : Present (0,1) 5VPA5934 Segment 2 : Present (0,2) 5VPA7132 Segment 3 : Present (0,4) 5VPAJ8EJ Segment 4 : Present (0,5) 5VPA6NAZ Segment 5 : Present (0,6) 5VPAJM8Q ---------------------------------------------------------------------- Physical Device information ---------------------------------------------------------------------- Device #0 Device is a Hard drive State : Online Supported : Yes Transfer Speed : SATA 3.0 Gb/s Reported Channel,Device(T:L) : 0,0(0:0) Reported Location : Connector 0, Device 0 Vendor : ST375052 Model : 5AS Firmware : JC4B Serial number : 6VPEFSZ0 Size : 715404 MB Write Cache : Enabled (write-back) FRU : None SMART : No SMART warnings : 0 NCQ status : Enabled Device #1 Device is a Hard drive State : Online Supported : Yes Transfer Speed : SATA 3.0 Gb/s Reported Channel,Device(T:L) : 0,1(1:0) Reported Location : Connector 0, Device 1 Vendor : ST375052 Model : 5AS Firmware : JC4B Serial number : 5VPA5934 Size : 715404 MB Write Cache : Enabled (write-back) FRU : None SMART : No SMART warnings : 0 NCQ status : Enabled Device #2 Device is a Hard drive State : Online Supported : Yes Transfer Speed : SATA 3.0 Gb/s Reported Channel,Device(T:L) : 0,2(2:0) Reported Location : Connector 0, Device 2 Vendor : ST375052 Model : 5AS Firmware : JC4B Serial number : 5VPA7132 Size : 715404 MB Write Cache : Enabled (write-back) FRU : None SMART : No SMART warnings : 0 NCQ status : Enabled Device #3 Device is a Hard drive State : Online Supported : Yes Transfer Speed : SATA 3.0 Gb/s Reported Channel,Device(T:L) : 0,3(3:0) Reported Location : Connector 0, Device 3 Vendor : ST500DM0 Model : 02-1BD142 Firmware : KC44 Serial number : Z2AD1834 Size : 476940 MB Write Cache : Enabled (write-back) FRU : None SMART : No SMART warnings : 0 NCQ status : Enabled Device #4 Device is a Hard drive State : Online Supported : Yes Transfer Speed : SATA 3.0 Gb/s Reported Channel,Device(T:L) : 0,4(4:0) Reported Location : Connector 1, Device 0 Vendor : ST375052 Model : 5AS Firmware : JC4B Serial number : 5VPAJ8EJ Size : 715404 MB Write Cache : Enabled (write-back) FRU : None SMART : No SMART warnings : 0 NCQ status : Enabled Device #5 Device is a Hard drive State : Online Supported : Yes Transfer Speed : SATA 3.0 Gb/s Reported Channel,Device(T:L) : 0,5(5:0) Reported Location : Connector 1, Device 1 Vendor : ST375052 Model : 5AS Firmware : JC4B Serial number : 5VPA6NAZ Size : 715404 MB Write Cache : Enabled (write-back) FRU : None SMART : No SMART warnings : 0 NCQ status : Enabled Device #6 Device is a Hard drive State : Online Supported : Yes Transfer Speed : SATA 3.0 Gb/s Reported Channel,Device(T:L) : 0,6(6:0) Reported Location : Connector 1, Device 2 Vendor : ST375052 Model : 5AS Firmware : JC4B Serial number : 5VPAJM8Q Size : 715404 MB Write Cache : Enabled (write-back) FRU : None SMART : No SMART warnings : 0 NCQ status : Enabled Device #7 Device is a Hard drive State : Online Supported : Yes Transfer Speed : SATA 3.0 Gb/s Reported Channel,Device(T:L) : 0,7(7:0) Reported Location : Connector 1, Device 3 Vendor : ST500DM0 Model : 02-1BD142 Firmware : KC44 Serial number : Z2AD1A3H Size : 476940 MB Write Cache : Enabled (write-back) FRU : None SMART : No SMART warnings : 0 NCQ status : Enabled Command completed successfully. 

Mettre à jour avec des informations de partition ajoutées cidessous :

 **fdisk -l** Disk /dev/sda: 499.3 GB, 499289948160 bytes 255 heads, 63 sectors/track, 60701 cylinders Units = cylinders of 16065 * 512 = 8225280 bytes Sector size (logical/physical): 512 bytes / 512 bytes I/O size (minimum/optimal): 512 bytes / 512 bytes Disk identifier: 0x0002ab26 Device Boot Start End Blocks Id System /dev/sda1 * 1 59952 481562624 83 Linux /dev/sda2 59953 60702 6022145 5 Extended /dev/sda5 59953 60702 6022144 82 Linux swap / Solaris WARNING: GPT (GUID Partition Table) detected on '/dev/sdb'! The util fdisk doesn't support GPT. Use GNU Parted. Disk /dev/sdb: 2997.9 GB, 2997878784000 bytes 255 heads, 63 sectors/track, 364471 cylinders Units = cylinders of 16065 * 512 = 8225280 bytes Sector size (logical/physical): 512 bytes / 512 bytes I/O size (minimum/optimal): 512 bytes / 512 bytes Disk identifier: 0x00000000 Device Boot Start End Blocks Id System /dev/sdb1 1 267350 2147483647+ ee GPT **df -h** Filesystem Size Used Avail Use% Mounted on /dev/sda1 453G 112G 319G 26% / none 1000M 224K 1000M 1% /dev none 1005M 0 1005M 0% /dev/shm none 1005M 664K 1004M 1% /var/run none 1005M 4.0K 1005M 1% /var/lock none 1005M 0 1005M 0% /lib/init/rw /dev/sdb1 2.7T 1.5T 1.1T 58% /media/raid1 /dev/sdb1 2.7T 1.5T 1.1T 58% /media/usbhd-sdb1 /dev/sda1 453G 112G 319G 26% /media/usbhd-sda1 **fstab** # /etc/fstab: static file system information. # # Use 'blkid -o value -s UUID' to print the universally unique identifier # for a device; this may be used with UUID= as a more robust way to name # devices that works even if disks are added and removed. See fstab(5). # # <file system> <mount point> <type> <options> <dump> <pass> proc /proc proc nodev,noexec,nosuid 0 0 # / was on /dev/sda1 during installation UUID=12dd3c31-6dba-4c26-ba81-88a76510bffd / ext4 errors=remount-ro 0 1 # swap was on /dev/sda5 during installation UUID=81618042-ec4e-45e9-947f-9198d29651d3 none swap sw 0 0 UUID=a7832728-5bf9-45c4-8a29-2824b4f2c250 /media/raid1 ext4 errors=remount-ro,noatime 0 1 

5 Solutions collect form web for “Quel disque est mauvais dans RAID6”

À less de me tromper, ces erreurs vous indiquent que vous avez des erreurs qui n'ont pas été corrigées par le controller RAID. Le controller RAID devrait cacher des erreurs de votre part. Je ne pense pas que vous ayez une défaillance de disque simple. Je pense que vous avez quelque chose de plus sérieux.

En supposant que le volume "boot" dans votre raid-setup est reconnu comme sda ​​et "data" comme sdb, votre système vous indique ce qui suit:

[2740390.344436] sd 4: 0: 1: 0: [sdb] Résultat: hostbyte = DID_OK driverbyte = DRIVER_SENSE

Le sous-système scsi a émis une command sans erreur pour le pilote lowlevel (pour votre carte adaptec) et la carte a répondu avec une erreur (DRIVE_SENSE est réglé).

[2740390.344439] sd 4: 0: 1: 0: [sdb] Sense Key: Hardware Error [current]

C'est le type d'erreur (voir les informations du pilote scsi ).

[2740390.344442] sd 4: 0: 1: 0: [sdb] Ajouter. Sens: échec de l'objective interne

Il s'agit d'informations supplémentaires que le pilote rapporte alors que cette information, autant que je sais, signifie «aucune information spécifique» / «aucune idée de ce qui ne s'est pas dérangé».

[2740390.344454] end_request: Erreur E / S, dev sdb, secteur 870177792

L'erreur a atteint la couche de bloc.

Comme indiqué dans une autre réponse: il ne s'agit pas d'une seule défaillance du disque, il s'agit d'une panne de l'set du raid. Vous devriez vérifier vos données avec attention et envisager de replace le sous-système RAID ou au less le controller.

Et vous devriez toujours (!) Activer "Vérification de la cohérence d'arrière-plan" / "Balayage passif" / "Vérifier" sur vos controllers de raid pour find une corruption silencieuse qui, autrement, pourrait tuer votre raid dans le cas d'une reconstruction.

Avez-vous vu des erreurs dans le système de files? Est-ce que / dev / sdb est partitionné / monté?

Cela va sembler drôle, mais avez-vous regardé à l'avant du server pour voir quel lecteur avait une LED d'erreur allumée? (en supposant que les lecteurs ont des DEL)

De plus, vous pouvez installer le logiciel du gestionnaire de stockage: http://www.adaptec.com/en-us/downloads/storage_manager/sm/productid=sas-3805&dn=adaptec+raid+3805.html

Il est possible que vous puissiez get l'information via smartctl (CLI) ou CLI d'Adaptec (comme mentionné ci-dessus)

Si vous pouvez redémarrer le server, faites-le à partir du DVD SmartStart. Si je me souviens que vous pouvez accéder à ACU à partir de là pour avoir une vue graphique des volumes RAID.

  • Supprimez le second lecteur RAID6 pendant le resync de la première défaillance?
  • Comment créer un tableau RAID6 dégradé utilisant megacli
  • Quel est le meilleur: RAID5 + 1 Hotspare / RAID6? [fermé]
  • MDADM RAID6 Défaut de 3/5 Drives
  • Le logiciel Linux mdadm RAID 6 - est-il compatible avec la récupération de corruption de bit?
  • Le groupe de volumes RAID de Areca 1280ml a échoué
  • Conseils pour la création du logiciel RAOS de CentOS mdadm RAID6
  • Récupération d'un RAID6 en utilisant ddrescue. mdadm: n'a pas pu append, argument invalide
  • Préoccupations d'échec simultané de SSD Raid1
  • Le système ne démarre pas à partir de RAID6 dégradé
  • 3Ware 9650SE RAID-6, deux disques dégradés, un ECC, une reconstruction bloquée
  • Les astuces du serveur de linux et windows, tels que ubuntu, centos, apache, nginx, debian et des sujets de rĂ©seau.