Diagnosticar es clave como primer paso para resolver cualquier problema. Aquí le vamos a indicar pasos a seguir que pueden usarse para cualquier problema y ayudarle a encontrar el origen del mismo.

Puede consultar guías específicas de diagnóstico por componentes en el menú de la derecha de esta Wiki.

También puede consultar el documento: Dell Server Troubleshooting guide.

Índice:

  1. Identificar los síntomas.
  2. Obtener los logs.
  3. Ejecutar diagnósticos.
  4. Analizar los síntomas, los logs y los resultados del diagnóstico.
  5. Aplicar posibles soluciones.
  6. Volver a probar para confirmar la resolución

Paso 1: Identificar los síntomas

  • Mensajes de error en el equipo (LED quad pack, panel frontal LCD).
  • Estado de las luces en los componentes.
  • Cambio de comportamiento (reiniciado, inestable).
  • Desde cuándo / qué ha cambiado (movido, actualizado, nuevo programa).

Paso 2: Obtener los logs

Hay varias herramientas disponibles para obtener los logs del servidor. Esta table muestra qué herramienta es la más adecuada para cada componente:

 

Componente

Herramienta

 Disco Duro 

Memoria

Procesador

Sistema
Operativo

 Blade Chassis 

DSET
Dell Server eSupport Tool

    

 Yes  

No

OMSA
OpenManage Server Administrator

    

 No

No

iDRAC
Integrated Dell Remote Access Controller

   

 No

No

CMC Logs
Chassis Mamagement Controller

 No

 No

 No

 No

Exportar los logs de la controladora RAID (PERC)
usando herramientas de software

 No

 No

 No

No

Paso 3: Ejecutar diagnósticos

Dell Hardware Diagnostics son diagnósticos integrados en el servidor. Tienen acceso a los componentes físicos del servidor y pueden identificar problemas de hardware que el sistema operativo u otras herramientas no pueden.

Las instrucciones sobre cómo acceder y usar a estas herramientas de diagnósticos están disponibles en este artículo SLN283546 - Cómo ejecutar diagnósticos de hardware en un servidor PowerEdge

Paso 4: Analizar los síntomas, los logs y los resultados del diagnóstico

Aquí es donde todos los pasos anteriores se unen para tener una imagen general del problema y poder decidir si un componente está fallando o si está vinculado con algún cambio realizado, un problema de software u otro motivo.

Paso 5: Aplicar posibles soluciones

Para cualquier tipo de problema, aplicar las últimas actualizaciones es siempre recomendado para solucionar o prevenir problemas. Tiene detalles sobre cómo actualizar en este artículo: Cómo mantener actualizado un servidor.

En función del resultado de su análisis, se pueden aplicar diferentes soluciones para resolver el problema (intercambiar componentes, actualizar firmware, reiniciar...) Es importante aplicar solo una solución al mismo tiempo y verificar si soluciona el problema. Sino los pasos de diagnóstico se mezclarán y no podremos identificar qué lo ha causado.

Paso 6: Volver a probar para confirmar la resolución

Confirmar la resolución es un paso importante que es frecuentemente olvidado o ignorado pero que le dará información importante si el problema vuelve a aparecer.

Para confirmar la resolución:

  1. Asegure que todos los síntomas han desaparecido en la mismas circunstancias que aparecían anteriormente.
  2. Limpiar los logs del sistema.
  3. Volver a ejecutar diagnósticos.
  4. Obtener de nuevo los logs del sistema. Servirán para tener logs del servidor sin errores.

Si todo ha ido bien siguiendo estos pasos, podemos considerar que el problema se ha resuelto.

Si necesita más información técnica puede consultar nuestra Base de ConocimientosManuales y Dell PowerEdge Servers Troubleshooting Guide