systemadmin.es > Hardware > Check de Nagios del estado del RAID de equipos Dell con SAS2008

Check de Nagios del estado del RAID de equipos Dell con SAS2008

Anteriormente mediante la utilidad command-line MegaCli se podía comprobar el estado del RAID ya que la DRAC no lo reporta. Hoy veremos un check de Nagios que comprueba el estado.

En otro post vimos que como varia el fichero /proc/scsi/sg/devices al quitar un disco del RAID. La controladora deberá ser la siguiente según el lspci, la que viene por ejemplo en los nuevos r410:

03:00.0 Serial Attached SCSI controller: LSI Logic / Symbios Logic SAS2008 PCI-Express Fusion-MPT SAS-2 [Falcon] (rev 02)

En otro fichero del proc podemos encontrar la descripción de cada dispositivo:

# cat /proc/scsi/sg/device_strs
Dell    	Virtual Disk    	1028
SEAGATE 	ST3300657SS     	ES62
SEAGATE 	ST3300657SS     	ES62
TEAC    	DVD-ROM DV-28SW 	R.2A

Gracias a este fichero podemos indicar que disco esta en fallo, por lo que nos quedaría un check tan simple como el siguiente:

#!/bin/bash

# systemadmin.es

LIST=$(cat /proc/scsi/sg/devices | awk '{ print $NF }')

COUNT=1
for i in $LIST;
do
	FAILED=$(cat /proc/scsi/sg/device_strs | head -n$COUNT | tail -n1)		

	if [ $i -eq "-1" ];
	then
		echo CRITICAL - $FAILED
		exit 2
	fi
	
	if [ $i -ne "1" ];
	then
		echo WTF - $FAILED
		exit 3
	fi

	let COUNT=COUNT+1
done

echo OK - $(cat /proc/scsi/sg/device_strs | sed 's/$/ -/' | paste $(perl -e "print \"- \"x$COUNT;"))

En el caso de no encontrar ningún disco en fallo obtendremos un OK y el listado de strings del fichero /proc/scsi/sg/device_strs:

# /usr/local/nagios/libexec/check_raid_dell2008
OK - Dell Virtual Disk 1028 - SEAGATE ST3300657SS ES62 - SEAGATE ST3300657SS ES62 - TEAC DVD-ROM DV-28SW R.2A -

En el caso de tener un disco marcado con -1 dará un CRITICAL junto con la cadena que lo representa:

# /usr/local/nagios/libexec/check_raid_dell2008
CRITICAL - SEAGATE ST3300657SS ES62

En caso que obtengamos un valor diferente a 1 (online) o -1 (offline) dará un UNKNOWN:

# /usr/local/nagios/libexec/check_raid_dell2008
WTF - SEAGATE ST3300657SS ES62

Con lo que deberemos revisar el estado del servidor.

2 comments to “Check de Nagios del estado del RAID de equipos Dell con SAS2008”

  1. Hola,

    este script me ha sido de mucha utilidad, gracias.

    Tenemos un script nagios para la otra controladora:

    03:00.0 SCSI storage controller: LSI Logic / Symbios Logic SAS1068E PCI-Express Fusion-MPT SAS (rev 08)

    La cual se basa en el comando lsiutil, pero al ejecutarlo en este servidor con la RAID Fusion-MPT SAS-2 esta nos aparece:

    LSI Logic MPT Configuration Utility, Version 1.56, March 19, 2008

    0 MPT Ports found

    ¿Sabes si hay alguna utilidad equivalente para esta RAID?

    Un saludo y muchas gracias

  2. No te se decir, ya que no tengo este modelo para decirte con seguridad. En la web de LSI existe un paquete con binarios que igual te son de ayuda

    Sino mira dentro del /proc/scsi a ver si lo encuentras

    saludos,

Deja un comentario:

XHTML - Tags permitidos:<a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <s> <strike> <strong>