Question

Je travaille dans un service informatique divisé en deux groupes. Un groupe développe et gère des applications, l’autre gère l’infrastructure et les serveurs de la société. L'un des problèmes auxquels nous sommes confrontés est une rupture de la communication. Je travaille pour le groupe d’applications et l’un des problèmes que j’ai rencontrés n’est pas averti lorsqu’un serveur est arrêté par une infrastructure ou lorsqu’une base de données est en cours d’actualisation.

Quelqu'un a-t-il des suggestions pour améliorer les communications entre les deux groupes ou des idées sur la façon de conserver un journal léger sur plusieurs systèmes (Linux et Windows)? Idéalement, ce serait bien si nous pouvions que nos boîtes envoient simplement un tweet sur leur statut ou quelque chose du genre.

Merci pour l'aide,

Ben

Était-ce utile?

La solution

Une chose à faire pour communiquer l’état du serveur consiste à ce que notre groupe Infrastructure mette en place un système de surveillance réseau tel que Nagios . Cela donnera à tous les membres de votre groupe d'applications la possibilité d'obtenir une vue instantanée de l'état de chaque serveur du système. Avoir ce type de statut est inestimable lorsque vous faites du développement.

Nagios vous permet de surveiller le réseau, mais vous permet également d'afficher les temps d'arrêt planifiés pour un serveur particulier du système.

Une autre chose que votre groupe pourrait faire pour favoriser la communication avec l'infrastructure consiste à faire en sorte que votre système de construction indique les serveurs qu'il utilise actuellement pour créer et tester vos produits.

Par ailleurs, la mise en place de réunions régulières entre les parties prenantes des deux groupes est probablement une bonne idée également. Si vous vous parlez tous les uns aux autres, même 15 minutes par semaine, vous verrez probablement des incidents comme celui que vous avez décrit ci-dessus se dégrader un peu.

Autres conseils

Je pense qu'il s'agit d'un problème plus important de contrôle du changement.

Vous devez disposer d'un contrôle des modifications matérielles et logicielles et d'un processus d'approbation.

En fin de compte, l’infrastructure vous sert. L’infrastructure informatique a pour but d’exécuter des applications.

Dans ma grande société de données financières actuelle, les serveurs ne sont pas TOUCHÉS sans autorisation appropriée via le groupe de clients et le groupe d'applications. Cela semble très pénible, mais chaque serveur est là pour une raison: atteindre un objectif commercial spécifique et exécuter une application spécifique. Il n’ya simplement aucune excuse pour que le groupe d’infrastructure change les choses ou perturbe les serveurs de son plein gré.

La réponse à une défaillance matérielle critique peut être une exception.

Les mises à jour de logiciels et de systèmes d'exploitation nécessaires sont gérées via des fenêtres de maintenance planifiée et un processus de modification approuvé.

J'aime aussi l'idée de Nagios. Si vous souhaitez configurer un outil de communication, je vous recommande un système de gestion de contenu tel que Drupal.

Nous utilisons Drupal en interne pour communiquer entre les équipes. Lorsqu'une équipe désactive un serveur, elle ajoute un événement à Drupal. Le reste d'entre nous l'obtiendrait soit par courrier électronique, par élément RSS, soit simplement en rafraîchissant la page.

Mettez en œuvre un processus de contrôle des modifications dans lequel les modifications sont soumises, approuvées et planifiées pour les groupes BOTH . Cela permet à tout le monde de savoir ce qui se passe. Ce processus peut être aussi léger ou lourd que vous le souhaitez.

Licencié sous: CC-BY-SA avec attribution
Non affilié à StackOverflow
scroll top