Pregunta

Tenemos más de 50 procesos por lotes Java que se ejecutan en diferentes momentos del día. Se ejecutan en una caja de Solaris y se inician a través de cron. Actualmente, la única forma de saber si tienen éxito o fallan es mediante un correo electrónico generado al final de cada proceso por lotes. Tenemos un equipo de soporte que monitorea estos correos electrónicos. Recientemente, hemos tenido problemas con los correos electrónicos que no se reciben, a pesar de que los lotes se están ejecutando. Debe haber una mejor manera.

Sin tener que reinventar la rueda, ¿hay alguna aplicación de monitoreo por lotes de código abierto?

Y una pregunta más general, ¿cuál es la mejor manera de monitorear los procesos por lotes?

¿Fue útil?

Solución

¿Existe actualmente algún sistema de gestión de lotes en el lugar? ¿O los trabajos se ejecutan a través del planificador del sistema operativo? (es decir, Windows Schedule Tasks o * nix cron )

Quartz es un programador de trabajos basado en Java de código abierto (licencia Apache) que tiene infraestructura en su lugar para escuchas que se pueden usar con fines de notificación, pero habría algún desarrollo de código involucrado.

Otros consejos

No sé acerca de las aplicaciones de monitoreo de lotes de código abierto, pero hay un nuevo subproyecto de Spring: Spring-Batch que proporciona un marco de procesamiento por lotes. Lo he usado con éxito en algunos proyectos nuevos.

Cuando inicia un trabajo por lotes, puede conectar un escucha de ejecución de trabajo. En mi caso, cuando el trabajo falla con una excepción, mi escucha de ejecución intercepta esto y envía un correo electrónico de error con el seguimiento de pila pertinente a una lista de correo electrónico conocida. Utilizo un Tasklet al final del lote para enviar un correo electrónico para indicar la finalización normal.

Por supuesto, si hay un error en el subsistema de correo electrónico (y el mensaje no se envía) todas las apuestas están canceladas ...

Debe haber una manera de usar Nagios para ver si las tareas diarias se han ejecutado con éxito, dado que puede monitorear las cosas de muchas maneras diferentes (desde archivos PID hasta archivos de texto, archivos de registro de arrastre, etc.). Lamentablemente, Nagios no está en mi línea de trabajo, así que no puedo ir más allá.

Licenciado bajo: CC-BY-SA con atribución
No afiliado a StackOverflow
scroll top