Buscar origen de falla: Instance ...was not run

Hola compañeros:

Hoy se presentó un problema con el SAP, que ya se resolvió, pero necesito ayuda para encontrar el origen de la falla.

Reporte general de usuarios: SAP no responde.
Intento acceder por SAPGUI y no se logra comunicación.
Accedo al SO y reviso espacios. Están correctos.
Acceso a la BD. Está funcional.
Intento acceder a la revisión de procesos desde el sistema operativo. Falla.
Con el usuario adm, desde el directorio de perfiles /sapmnt//profile
cd /sapmnt/PRD/profile
dpmon pf=PRD_DVEBMGS00_SAPPROD
DpMonAttach failed – possibly no dispatcher running
DPMon: External/Internal dplib version:116/184

El log de la base de datos no presenta errores ni advertencias.

Por la urgencia de reiniciar la aplicación, no generé respaldo de los logs.

Reinicié la aplicación de SAP (stopsap R3 / startsap R3 en menos de dos minutos) y se monitorean los procesos.
Se accede exitosamente al SAP por SAPGUI.
Se notifica a Soporte Técnico para que avise a los usuarios que la instancia está disponible.
Se revisa el log de la base de datos. No se encuentra error o advertencia alguna.
En la ST22 no aparece ningún error:
En la SM21 aparecen mensajes de desconexión con detalles como el siguiente:
Paquete STSK
Technical details
Tipo SysLog m Error (función,módulo,línea)
Datos variables Workp. 29 17886 wp_haltWPStop dpuxtool317#
ID transacción
ID contxt.global
ID de conexión
Contador de llamadas 0

Copié los archivos /usr/sap/PRD/DVEBMGS00/work/*.old, aunque me pierdo entre tantos datos, la principal pista está en /usr/sap/PRD/DVEBMGS00/work/dev_disp.old

Mon Feb 22 13:30:41 2016
*** ERROR => Internet Communication Manager (pid 15050) died [dpIcman.c 282]
DpSkipSnapshot: last snapshot created at Mon Feb 22 13:28:44 2016
, skip new snapshot
*** WARNING => NiIHdlSetParamNoSslSessionDone: call on non SSL connection [nixxi.cpp 11068]

Mon Feb 22 13:30:42 2016
DpHdlDeadWp: W26 (pid=17848) terminated automatically

Mon Feb 22 13:31:12 2016
DpHdlDeadWp: W28 (pid=16945) terminated automatically

Mon Feb 22 13:31:42 2016
DpHdlDeadWp: W26 (pid=17897) terminated automatically

Mon Feb 22 13:31:43 2016
DpLoopExec: Exit requested, shut down
DpSkipSnapshot: last snapshot created at Mon Feb 22 13:28:44 2016
, skip new snapshot
DpHalt: shutdown server >SAPPROD_PRD_00 < (normal)
DpModState: change server state from ACTIVE to SHUTDOWN
DpHalt: stop work processes

En google encontré “…It was due to swap size which led to the issue” y recomiendan que incremente la memoria swap del sistema operativo, pero no encuentro la suficiente justificación para ello.

Otros datos clave:
Instance DVEBMGS00 was not running
SM21: SAP Workp. wp_haltWPStop dpuxtool

¿Cómo puedo encontrar, a ciencia cierta, el origen de la falla y su solución?

Les agradezco de antemano la ayuda que me puedan proporcionar.

1 me gusta

Interesante…
Pero… qué versión de SAP ECC es? Y qué versión de SAP GUI estás corriendo?

como es que lo resolviste y no sabes el error?

Saludos

Cierto, se me pasó esa información básica:

SAP System DAta: EHP7 for SAP ERP 6.0

Host Data
Operatoing system: HP-UX
Machine tyé ia64
Server name SAPPROD_PRD_00
Platform ID 274

Database data
Database System Oracle
Release 11.2.0.3.0
Name PRD
Host SAPPORD
Owner SAPPRD

SAP_BASIS 740 0003 SAPKB74003 SAP Basis Component
SAP_ABA 740 0003 SAPKA74003 Cross-Application Component
SAP_GWFND 740 0003 SAPK-74003INSAPGWFND SAP Gateway Foundation 7.40
SAP_UI 740 0003 SAPK-74003INSAPUI User Interface Technology 7.40
PI_BASIS 740 0003 SAPK-74003INPIBASIS Basis Plug-In
ST-PI 2008_1_700 0008 SAPKITLRD8 SAP Solution Tools Plug-In
SAP_BW 740 0003 SAPKW74003 SAP Business Warehouse

La interfase es SAP Logon 730
Pero da igual, porque no había conexión por SAP GUI, SAP Console o RFC, tampoco por el sistema operativo con cd /sapmnt/PRD/profile dpmon pf=PRD_DVEBMGS00_SAPPROD

Tan solo reinicié la instancia de SAP.
Primero revisé el sistema operativo >> OK
Revisé la BD >> OK
Revisé la insntancia de SAP cd /sapmnt/PRD/profile, dpmon pf=PRD_DVEBMGS00_SAPPROD >> Fallido: DpMonAttach failed – possibly no dispatcher running
Reinicié la instancia, sin dar de baja la BD: stopsap R3 / startsap R3
Reinició sin problemas en menos de dos minutos.

El punto es encontrar el origen de la falla para que no se vuelva a repetir.
En esta ocasión sucedió cuando yo estaba en la oficina, así que el tiempo de paro fue mínimo.
Pero si se vuelve a repetir, y yo no estoy en la oficina, el tiempo de paro puede ser grande.

Básicamente sí sabía el error: SAP no respondía, además del siguiente mensaje: “DpMonAttach failed – possibly no dispatcher running”.
Lo que busco es la causa raíz del error.

Prueba actualizar el SAP Logon a la última versión (con sus respectivos parches). Al menos saquemos esa hipótesis. :stuck_out_tongue:

OK, siempre es lo mejor tener la última versión del SAP Logon para evitar cualquier falla.

Hola Luis,

Hay dos posibles causas.

  1. La mas probable es el transaction log (archive log en oracle), el file system se llena y la base de datos deja de responder, SAP sigue arriba pero no puedes conectar.

  2. Creo que revisaste el punto 1 y no es tu caso, por lo cual me queda decirte que algun Filesystem que tiene los binarios de SAP se encontraba en mal estado, desmontado o con corrupciones de archivos. Puedo creer que era el /usr/sap/SID/DVMSG00/exe, cuando reinicias instancia el toma el kernel del /sapmnt/ y lo actualiza en exe de instancia, seguramente por ello se soluciono el error con el reinicio.

Cordial Saludo,
William Neira

4 Me gusta

Así es wlneira, el punto 1 no era.
En cuanto al punto 2 es interesante lo que mencionas. Parece aplicar a la situación.

Gracias por la info.

Oye si @wlneira lo dice asi es, el Basis por excelencia de este grupo. +5

OK. Ya que fue un incidente aislado, que espero que no se vuelva a repetir, y la explicación de William tiene sentido, doy por terminada la consulta.
Les agradezco mucho su colaboración.

1 me gusta

Luis, marca la solución, para que pueda ser consultada a futuro, gracias.