systemadmin.es > Storage > Ver el estado del RAID de equipos Dell con SAS2008 mediante /proc/scsi/sg/devices

Ver el estado del RAID de equipos Dell con SAS2008 mediante /proc/scsi/sg/devices

El pequeño binario (MegaRAID) que permitía ver el estado de los RAIDs ha dejado de funcionar en los nuevos equipos Dell r410 con nuevas controladoras:

03:00.0 Serial Attached SCSI controller: LSI Logic / Symbios Logic SAS2008 PCI-Express Fusion-MPT SAS-2 [Falcon] (rev 02)

Vamos a ver como ver el estado de los discos mediante el /proc/scsi/sg/devices:

Dentro de /proc/scsi/sg podemos encontrar dos ficheros que nos van a resultar útiles:

  • device_hdr: Con la descripción de cada columna
  • devices: Fichero con el resumen del estado de la controladora

Podemos ver un ejemplo simple:

# cat /proc/scsi/sg/device{_hdr,s}
host	chan	id	lun	type	opens	qdepth	busy	online
0       1       0       0       0       1       128     0       1
0       0       0       0       0       1       254     0       1
0       0       1       0       0       1       254     0       1
3       0       0       0       5       1       1       0       1

Se trata de un equipo con una controladora y dos discos en RAID1. Si nos fijamos en la columna qdepth deducimos que los 254 se refiere a los discos, el 128 al RAID0 (el VirtualDevice) y el 1 supongo que a la misma controladora.

Actualizado: Según vemos más adelante al hacer el check de Nagios para controladoras SAS2008 de equipos Dell, se trata del lector de DVD.

En el caso de quitar un disco veremos lo siguiente en dicho fichero:

# cat /proc/scsi/sg/device{_hdr,s}
host	chan	id	lun	type	opens	qdepth	busy	online
0       1       0       0       0       1       128     0       1
-1      -1      -1      -1      -1      -1      -1      -1      -1
0       0       1       0       0       1       254     0       1
3       0       0       0       5       1       1       0       1

Resulta extraño que el RAID no se ve afectado por la degradación de un disco marcando la columna online con otro valor por lo que es de suponer que simplemente marca 1: online, -1: offline.

El formato del fichero resulta fácil de parsear, por lo que no será difícil hacer un check en el Nagios para comprobar el estado de los discos con esta controladora nueva gracias a este fichero. Es una pena que no funcione para controladoras más antiguas como las de un Dell PowerEdge 1950 o los 2950:

# cat /proc/scsi/sg/device{_hdr,s} 
host	chan	id	lun	type	opens	qdepth	busy	online
0	0	32	0	13	1	128	0	1
0	2	0	0	0	1	128	12	1

Deja un comentario:

XHTML - Tags permitidos:<a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <s> <strike> <strong>