Check de Nagios del estado del RAID de equipos Dell con SAS2008
Anteriormente mediante la utilidad command-line MegaCli se podía comprobar el estado del RAID ya que la DRAC no lo reporta. Hoy veremos un check de Nagios que comprueba el estado.
En otro post vimos que como varia el fichero /proc/scsi/sg/devices al quitar un disco del RAID. La controladora deberá ser la siguiente según el lspci, la que viene por ejemplo en los nuevos r410:
03:00.0 Serial Attached SCSI controller: LSI Logic / Symbios Logic SAS2008 PCI-Express Fusion-MPT SAS-2 [Falcon] (rev 02)
En otro fichero del proc podemos encontrar la descripción de cada dispositivo:
# cat /proc/scsi/sg/device_strs Dell Virtual Disk 1028 SEAGATE ST3300657SS ES62 SEAGATE ST3300657SS ES62 TEAC DVD-ROM DV-28SW R.2A
Gracias a este fichero podemos indicar que disco esta en fallo, por lo que nos quedaría un check tan simple como el siguiente:
#!/bin/bash
# systemadmin.es
LIST=$(cat /proc/scsi/sg/devices | awk '{ print $NF }')
COUNT=1
for i in $LIST;
do
FAILED=$(cat /proc/scsi/sg/device_strs | head -n$COUNT | tail -n1)
if [ $i -eq "-1" ];
then
echo CRITICAL - $FAILED
exit 2
fi
if [ $i -ne "1" ];
then
echo WTF - $FAILED
exit 3
fi
let COUNT=COUNT+1
done
echo OK - $(cat /proc/scsi/sg/device_strs | sed 's/$/ -/' | paste $(perl -e "print \"- \"x$COUNT;"))
En el caso de no encontrar ningún disco en fallo obtendremos un OK y el listado de strings del fichero /proc/scsi/sg/device_strs:
# /usr/local/nagios/libexec/check_raid_dell2008 OK - Dell Virtual Disk 1028 - SEAGATE ST3300657SS ES62 - SEAGATE ST3300657SS ES62 - TEAC DVD-ROM DV-28SW R.2A -
En el caso de tener un disco marcado con -1 dará un CRITICAL junto con la cadena que lo representa:
# /usr/local/nagios/libexec/check_raid_dell2008 CRITICAL - SEAGATE ST3300657SS ES62
En caso que obtengamos un valor diferente a 1 (online) o -1 (offline) dará un UNKNOWN:
# /usr/local/nagios/libexec/check_raid_dell2008 WTF - SEAGATE ST3300657SS ES62
Con lo que deberemos revisar el estado del servidor.
Relacionados
Imprimir
20. December 2010 at 9:31 am :
Hola,
este script me ha sido de mucha utilidad, gracias.
Tenemos un script nagios para la otra controladora:
03:00.0 SCSI storage controller: LSI Logic / Symbios Logic SAS1068E PCI-Express Fusion-MPT SAS (rev 08)
La cual se basa en el comando lsiutil, pero al ejecutarlo en este servidor con la RAID Fusion-MPT SAS-2 esta nos aparece:
LSI Logic MPT Configuration Utility, Version 1.56, March 19, 2008
0 MPT Ports found
¿Sabes si hay alguna utilidad equivalente para esta RAID?
Un saludo y muchas gracias
20. December 2010 at 9:42 am :
No te se decir, ya que no tengo este modelo para decirte con seguridad. En la web de LSI existe un paquete con binarios que igual te son de ayuda
Sino mira dentro del /proc/scsi a ver si lo encuentras
saludos,