Pregunta

Trabajo en un departamento de TI que se divide en dos grupos. Un grupo desarrolla y administra aplicaciones, el otro administra la infraestructura y los servidores de la compañía. Uno de los problemas que enfrentamos es una falla en la comunicación. Trabajo para el grupo de aplicaciones y uno de los problemas que tengo no es que me notifiquen cuando la infraestructura derriba un servidor o se actualiza una base de datos.

¿Alguien tiene sugerencias sobre cómo mejorar las comunicaciones entre los dos grupos o alguna idea sobre cómo mantener un registro ligero en varios sistemas (tanto Linux como Windows)? Idealmente, sería bueno si pudiéramos hacer que nuestras cajas tuiteen sus estados o algo así.

Gracias por la ayuda,

Ben

¿Fue útil?

Solución

Una cosa que puede hacer para comunicar el estado del servidor es que nuestro grupo de Infraestructura configure un sistema de monitoreo de red como Nagios . Esto le dará a todos los miembros de su grupo de aplicaciones la posibilidad de obtener una vista instantánea del estado de cada servidor en el sistema. Tener este tipo de estado es invaluable cuando se está desarrollando.

Nagios le proporciona monitoreo de red, pero también le permite mostrar el tiempo de inactividad programado para un servidor en particular en el sistema.

Otra cosa que su grupo podría hacer para fomentar la comunicación con la Infraestructura es hacer que su sistema de compilación informe qué servidores está utilizando actualmente para construir y probar sus productos.

Además, establecer una reunión regular entre las partes interesadas de ambos grupos es probablemente una buena idea también. Si todos hablan entre sí, incluso durante 15 minutos a la semana, probablemente verán que los incidentes como el que describieron anteriormente disminuirán bastante.

Otros consejos

Creo que este es un problema mayor de control de cambios.

Debe tener control de cambios de hardware y software y un proceso de aprobación.

En última instancia, la infraestructura le sirve: el propósito de la infraestructura de TI es ejecutar aplicaciones.

En mi actual gran compañía de datos financieros, los servidores no se TOCAN sin la autorización adecuada a través del cliente y los grupos de aplicaciones. Parece un gran dolor, pero cada servidor está ahí por una razón: para cumplir con un objetivo comercial específico y ejecutar una aplicación específica. Simplemente no hay excusa para que el grupo de infraestructura cambie las cosas o altere los servidores por su propia voluntad.

La respuesta a fallas críticas de hardware podría ser una excepción.

Las actualizaciones necesarias de software y sistema operativo se manejan a través de ventanas de mantenimiento programadas y un proceso de cambio aprobado.

También me gusta la idea de Nagios. Si desea configurar algo que sea más una herramienta de comunicación, le recomendaría un sistema de administración de contenido como Drupal.

Utilizamos Drupal internamente para comunicarnos entre equipos. Cuando un equipo retira un servidor, agregaría un evento a Drupal. El resto de nosotros lo recibiríamos como un correo electrónico, un elemento RSS o simplemente actualizando la página.

Implemente un proceso de control de cambios donde los cambios se envíen, aprueben y programen para AMBOS grupos. Esto les permite a todos saber lo que está sucediendo. Este proceso puede ser tan ligero o pesado como desee.

Licenciado bajo: CC-BY-SA con atribución
No afiliado a StackOverflow
scroll top