Pergunta

Eu trabalho em um departamento de TI dividido em dois grupos. Um grupo desenvolve e gerencia aplicativos, o outro gerencia a infraestrutura e os servidores da empresa. Um dos problemas que enfrentamos é uma quebra na comunicação. Trabalho para o grupo de aplicativos e um dos problemas que tenho não está sendo notificado quando um servidor é retirado por infraestrutura, ou um banco de dados está sendo atualizado.

Alguém tem sugestões sobre como melhorar as comunicações entre os dois grupos ou quaisquer idéias sobre como manter um log leve em vários sistemas (tanto Linux quanto Windows)? Idealmente, seria bom se pudéssemos ter nossas caixas apenas twittarem seus status ou algo assim.

Obrigado pela ajuda,

Ben

Foi útil?

Solução

Uma coisa que você poderia fazer para comunicar o status do servidor é ter nosso grupo de infraestrutura configurado um sistema de monitoramento de rede como Nagios. Isso dará a todos em seu grupo de aplicativos a capacidade de obter uma visão instantânea do status de todos os servidores do sistema. Ter esse tipo de status é inestimável quando você está fazendo desenvolvimento.

O NAGIOS oferece monitoramento de rede, mas também permite que você mostre tempo de inatividade programado para um servidor específico no sistema.

Outra coisa que seu grupo poderia fazer para promover a comunicação com a infraestrutura é ter o seu sistema de construção relatório de quais servidores está usando atualmente para criar e testar seus produtos.

Além disso, a criação de reuniões regulares entre as partes interessadas de ambos os grupos provavelmente também é uma boa ideia. Se todos vocês estão conversando, mesmo por 15 minutos por semana, provavelmente verá incidentes como o que você descreveu acima cair um pouco.

Outras dicas

Eu acho que essa é uma questão maior de controle de mudanças.

Você deve ter controle de alteração de hardware e software e um processo de aprovação.

Por fim, a infraestrutura atende - o objetivo da infraestrutura de TI é executar aplicativos.

Na minha empresa atual de grandes dados financeiros, os servidores não são tocados sem a autorização adequada através do cliente e dos grupos de aplicativos. Parece uma dor enorme, mas todos os servidores estão lá por um motivo - atingir uma meta comercial específica e executar um aplicativo específico. Simplesmente não há desculpa para o grupo de infraestrutura mudar as coisas ou perturbar os servidores por sua própria vontade.

A resposta à falha crítica de hardware pode ser uma exceção.

As atualizações necessárias de software e SO são tratadas através de janelas de manutenção programadas e um processo de alteração aprovado.

Eu gosto da ideia de Nagios também. Se você deseja configurar algo que seja mais uma ferramenta de comunicação, eu recomendaria um sistema de gerenciamento de conteúdo como o Drupal.

Usamos o Drupal internamente para se comunicar entre as equipes. Quando uma equipe abaixa um servidor, ele adicionava um evento ao Drupal. O resto de nós o receberá como um email, um item RSS ou apenas atualizando a página.

Implementar um processo de controle de alterações em que as alterações são enviadas, aprovadas e agendadas para AMBAS grupos. Isso permite que todos saibam o que está acontecendo. Esse processo pode ser tão leve ou pesado quanto você deseja.

Licenciado em: CC-BY-SA com atribuição
Não afiliado a StackOverflow
scroll top