systemadmin.es > Kernel > BUG: soft lockup – CPU#0 stuck for 17163091988s!

BUG: soft lockup – CPU#0 stuck for 17163091988s!

Un molesto bug afecta a CentOS y RHEL con kernels inferiores a la versión 2.6.32-220.4 que provoca un kernel panic en el sistema con un uptime del sistema superior a 208,5 días.

El fin de los días (208,5)

El fin de los días (208,5)

Este bug afecta a la plataforma Intel tanto en CentOS 5 i CentOS 6, la única versión no afectada es la 5.9. El error que veremos es:

Aug 15 03:20:45 q3 kernel: BUG: soft lockup - CPU#0 stuck for 17163091988s! [java:2014]

Dicho bug del kernel lo podemos encontrar en otros dispositivos, por ejemplo los BIG-IP de F5. En todos los casos se resuelve únicamente actualizando el kernel.

En el caso que el bloqueo sea de tiempo inferior, como en el siguiente caso:

Jul  1 06:20:24 q3 kernel: BUG: soft lockup - CPU#0 stuck for 61s! [java:322]

En este caso, NO se trata del mismo bug, sino de algún otro que desencadena que un determinado proceso se quede bloqueado, pero no producirá ningún kernel panic

2 comments to “BUG: soft lockup – CPU#0 stuck for 17163091988s!”

  1. Nunca me había parado a pensar que podría afectar a appliances basados en Linux 🙂

    Si mal no recuerdo, este bug se puede mitigar cambiando el clock-source para no utilizar TSC, es el que se utiliza por defecto.

    Pero cuidado: probablemente va a afectar al rendimiento de algunas aplicaciones. Te dejo una imagen de un benchmark que hicimos sobre un memcached, en el cambio de TSC a HPET y/o ACPI el rendimiento cae un +50% !!

    http://i.imgur.com/QUvdh1T.png

  2. Impresionante el cambio! Muchas gracias por pasar esta imàgen

Deja un comentario:

XHTML - Tags permitidos:<a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <s> <strike> <strong>