Pergunta

Temos 50 + Java processos batch que são executados em diferentes momentos do dia. Eles correm em uma caixa de Solaris, e são iniciados via cron. Atualmente, a única maneira que nós só sabemos se eles ter sucesso ou falhar é por um e-mail gerado no final de cada processo em lote. Temos uma equipe de suporte que monitora esses e-mails. Recentemente, nós tivemos problemas com e-mails não estão sendo recebidos, mesmo que os lotes estão em execução. Deve haver uma maneira melhor.

Sem ter que reinventar a roda, há algum lote open source monitoramento de aplicações?

E uma questão mais geral, qual é a melhor maneira de processos monitor de lote?

Foi útil?

Solução

Existe atualmente algum sistema de gerenciamento de lote no local? Ou os trabalhos executados através do programador OS? (Ie, Schedule Tasks Windows ou * nix cron)

Quartz é uma fonte aberta (Apache License) baseada em java agendador de tarefas que tem infra-estrutura no lugar para ouvintes que pode ser usado para fins de notificação, mas não haveria algum desenvolvimento código envolvido.

Outras dicas

Eu não sei sobre aplicações de monitoramento de lotes de código aberto, mas há uma nova sub projecto da Primavera: Primavera-Batch que fornece uma estrutura de processamento em lote. Eu usei-o com sucesso em alguns novos projetos.

Quando você começar um trabalho em lotes você pode conectar-se um ouvinte execução do trabalho. No meu caso, quando o trabalho falhar com uma exceção, minha execução ouvinte intercepta este e envia um e-mail de erro com o rastreamento de pilha pertinente para uma lista de e-mail bem conhecida. Eu uso um Tasklet no final do lote para enviar um e-mail para indicar a conclusão normal.

Claro que, se houver um erro no subsistema de e-mail (e a mensagem não é enviado) todas as apostas estão fora ...

Deve haver uma maneira de usar o Nagios para ver se as tarefas diárias ter executado com sucesso, uma vez que ele pode monitorar coisas em muitas maneiras diferentes (a partir de arquivos PID para arquivos de texto estar presente, para arquivos de log de arrasto, etc). Infelizmente Nagios não está na minha linha de trabalho, então não posso ir mais longe.

Licenciado em: CC-BY-SA com atribuição
Não afiliado a StackOverflow
scroll top