Power Edge 2950 E1810 HDD 2 Fault

Servidores

Servidores
Soporte, consejos y tutoriales sobre Servidores Dell

Power Edge 2950 E1810 HDD 2 Fault

Esta pregunta ha sido respondida por David López Anguita

Power Edge 2950 E1810 HDD 2 Fault

Buen dia:

Estoy laborando en el área de soporte IT de mi empresa. Tengo conocimientos básicos en servidores físicos aunque en tema de arreglos RAIDs no soy experto. Espero puedan apoyarme con un problema que tengo muy parecido al de una persona que posteo en el foro en 2012 y trata acerca de daño físico de un DD de un arreglo RAID. Al igual que la persona que publico, no soy experto en servidores y al ingresar a la empresa hace mas de un año, encontré el equipo ya configurado con su RAID, SO, AD, etc.

Hace un mes aproximadamente me percate del error en el servidor, el cual describo a continuación:

E1810 HDD 2 Fault

W1228 ROMB Batt < 24 HR

E1211 ROMB Batt

Revisando el servidor y sus RAID con Open Manager Server Administrator me indica que tengo dos controladoras RAID:

RAID 0 con discos físicos ID: 0, 1, 2, 3

RAID 1 con discos físicos ID: 4, 5

Y dos discos virtuales

Virtual Disk 0 (disco físico 0, 1) en diseño RAID-1

Virtual Disk 1 (disco físico 3, 4) en diseño RAID-5

El disco dañado es el DD con ID: 2

Estuve leyendo foros en Dell y encontré información que mencionan que el problema es daño físico en DD y hay que cambiarlo pero tengo duda respecto a si el cambio del disco se puede hacer en caliente sin alterar la configuración del RAID y se reconstruya sin problema, o si se debe cambiar el DD apagado el servidor y la reconstruccion es automática o debo volver a configurar el arreglo de DD?? Hay algún procedimiento para realizar el cambio de DD en RAID?? O procedimiento de configuracion de RAID??

El cambio de la batería se puede hacer de igual forma con el servidor encendido?? según me parecio entender que si se puede ya que la batería es para mantener activa la memoria cache y mientras el equipo este encendido nada mas se alenta la transacción de información pero la batería se puede cambiar hotswap.

Mi equipo desafortunadamente ya no cuenta con garantía, es un server Power Edge 2950 con Service Tag: [editado].

Extraje el DSET y si me pueden apoyar les estaría enviando el archivo zipeado posteriormente a su confirmación de apoyo. Estuve leyendo el log y observe que el disco duro dañado tiene el ID: 0:0:2 es marca Seagate con ID: ST3300555SS y en el Open Manager me aparece con capacidad y espacio de 0 Gb, fallido.

Gracias de antemano por la atención.

Saludos.

Respuesta comprobada
  • Estimado cliente,

    Gracias por contactarnos, le he enviado un mail para que pueda enviarme el Dset y así poder revisarlo.

    Un saludo

  • Hola,

    Gracias por enviarme el fichero.

    Actualmente el servidor presenta 2 problemas que se solucionarían cambiando los componentes hardware:

     1. Disco 0:0:2 en fallo, por lo que el Disco Virtual 1 – RAID 5 está degradado, si ahora falla otro disco del mismo RAID se perderían los datos, por lo que le recomiendo haga backup de los datos.

    El disco se puede quitar en caliente, tiene la información sobre cómo sustituirlo en el manual: Manuales y documentación para su PowerEdge 2950.

      2. La batería de la controladora hay que sustituirla. No se puede hacer en caliente, hay que apagar completamente el servidor. En la página 79 del manual tiene las instrucciones: Manuales y documentación para su PowerEdge 2950.

     02/14/17 15:35:44: EVT#37613-02/14/17 15:35:44: 150=Battery needs replacement - SOH Bad

     Además le recomiendo:

    -         Pensar en que este servidor tiene ya 10 años por lo que si falla la placa base o algún otro componente Dell no tendrá piezas en stock.

    -          Borrar el registro de errores hardware que actualmente está lleno desde 2014, siga los pasos de este artículo: Cómo borrar el registro de ESM en un servidor Dell PowerEdge.

    -          Mantener actualizado los niveles de driver y firmware: Cómo actualizar los servidores Dell PowerEdge a través de medios de arranque/ISO.

     

    Un saludo

Todas las respuestas
  • Estimado cliente,

    Gracias por contactarnos, le he enviado un mail para que pueda enviarme el Dset y así poder revisarlo.

    Un saludo

  • Buena tarde Ing. David:

    Ya envie el Dset y archivo log adicional para su análisis.

    Estare al pendiente de sus comentarios.

    Saludos.

  • Hola,

    Gracias por enviarme el fichero.

    Actualmente el servidor presenta 2 problemas que se solucionarían cambiando los componentes hardware:

     1. Disco 0:0:2 en fallo, por lo que el Disco Virtual 1 – RAID 5 está degradado, si ahora falla otro disco del mismo RAID se perderían los datos, por lo que le recomiendo haga backup de los datos.

    El disco se puede quitar en caliente, tiene la información sobre cómo sustituirlo en el manual: Manuales y documentación para su PowerEdge 2950.

      2. La batería de la controladora hay que sustituirla. No se puede hacer en caliente, hay que apagar completamente el servidor. En la página 79 del manual tiene las instrucciones: Manuales y documentación para su PowerEdge 2950.

     02/14/17 15:35:44: EVT#37613-02/14/17 15:35:44: 150=Battery needs replacement - SOH Bad

     Además le recomiendo:

    -         Pensar en que este servidor tiene ya 10 años por lo que si falla la placa base o algún otro componente Dell no tendrá piezas en stock.

    -          Borrar el registro de errores hardware que actualmente está lleno desde 2014, siga los pasos de este artículo: Cómo borrar el registro de ESM en un servidor Dell PowerEdge.

    -          Mantener actualizado los niveles de driver y firmware: Cómo actualizar los servidores Dell PowerEdge a través de medios de arranque/ISO.

     

    Un saludo

  • Buen dia Ing. David:

    Recibi la información y me pondré manos a la obra para los cambios a realizar, asi como evaluar las recomendaciones que me observa sobre la edad del servidor y sus implicaciones.

    Agradezco su amable apoyo asi como la pronta respuesta.

    Reciba un cordial saludo y seguimos en contacto.

    Gracias.

  • Estimado David:

    Solo me queda duda, debido a que no sabemos el modelo y la capacidad del DD dañado, puedo retirarlo para tomar los datos y enseguida volver a colocarlo en lo que me llega la refaccion?? Este movimiento temporal no ocasiona cambios en el RAID?? El archivo log y el DSET solo nos indica la marca del DD y su numero de parte. Quiero pensar que si el disco forma parte del RAID-5, debe ser de la misma capacidad de los demás discos que forman parte de ese arreglo en este caso de 278.88 Gb???

    En resumen, puedo retirar el disco duro dañado, tomar los datos y volverlo a colocar?? Posteriormente que me llegue el disco duro nuevo, hacer el cambio definitivo??

    Saludos.

  • Hola,

    El disco original es el modelo: ST3300555SS, el Part Number de Dell es:G8774 y es un disco de 300GB SAS, 10K, 3.5" . Básicamente necesita un disco SAS de 3.5" de 10000 o 15000 RPM que sea mínimo de 300GB, puede ser más grande, no influye en el RAID.

    Aún así si quiere puede quitarlo, pero no lo vuelva a poner, solo ponga un disco nuevo, si pone de nuevo el disco que está en fallo podría provocar problemas en el RAID.

    Un saludo

  • Buena tarde Ing. David.

    Después de tus recomendaciones sobre la batería y el DD dañado en mi server Poweredge 2950. Recibi las partes e instale sin problema. El server ya no me despliega errores de Batt ni DD pero tengo un grandísimo problema ahora. Parece que el RAID, se desconfiguro o no se recreo correctamente y ahora el disco físico 4 me aparece con el estado de Foreing y no me da mas opciones para corregir algo en el campo "Tasks" mas que "blink y unblink". Cabe señalar que el disco 2 que fue el que cambie me desplego la opción de Assign Global Hot Spare y le di ejecutar. Ademas revisando el administrador de discos de mi servidor me muestra el disk 1 sin formato, unknow y not installed. si le doy inicializar disco, me envía un error de Administrador de discos virtuales: System cannot find the file specified.

    Que estará sucediendo ahora??

    Tendre que adquirir otro disco para instalar como disco físico 4 que me aparece como Foreign??

    Me urge solucionar esto porque mi servidor de archivos solo me despliega las carpetas pero sin archivos, prácticamente no tengo información y es un servidor productivo. Tome pantallas de como se encuentra el arreglo RAID en estos momentos. Las adjunto esperando puedas visualizarlas.

    Agradezco el apoyo.