質問

私は2つのグループに分かれているIT部門で働いています。 1つのグループはアプリケーションを開発および管理し、もう1つのグループは会社のインフラストラクチャとサーバーを管理します。私たちが直面している問題の一つは、コミュニケーションの崩壊です。私はアプリケーショングループで働いていますが、インフラストラクチャによってサーバーがダウンしたとき、またはデータベースが更新されたときに通知されないという問題があります。

2つのグループ間のコミュニケーションを改善する方法についての提案や、複数のシステム(LinuxとWindowsの両方)で軽量ログを保持する方法についてのアイデアはありますか?理想的には、ボックスにステータスなどをツイートするだけでいいと思います。

助けてくれてありがとう、

ベン

役に立ちましたか?

解決

サーバーステータスを通信するためにできることの1つは、インフラストラクチャグループに Nagios 。これにより、アプリケーショングループの全員がシステム内のすべてのサーバーのステータスのスナップショットビューを取得できます。この種のステータスを持つことは、開発を行う際に非常に貴重です。

Nagiosはネットワーク監視を提供しますが、システム内の特定のサーバーのスケジュールされたダウンタイムを表示することもできます。

インフラストラクチャとのコミュニケーションを促進するためにあなたのグループができる別のことは、製品のビルドとテストに現在使用しているサーバーをビルドシステムに報告させることです。

また、両方のグループの利害関係者の間で定期的な会議を設定することも、おそらく良い考えです。全員が1週間に15分間会話している場合でも、上記で説明したようなインシデントがかなり少なくなる可能性があります。

他のヒント

これは変更管理の大きな問題だと思います。

ハードウェアおよびソフトウェアの変更管理と承認プロセスが必要です。

最終的に、インフラストラクチャはあなたに役立ちます-ITインフラストラクチャの目的はアプリケーションを実行することです。

現在の大規模な金融データ会社では、クライアントとアプリケーショングループを介した適切な承認がない限り、サーバーはタッチされません。大変な苦痛のように思えますが、特定のビジネス目標を達成し、特定のアプリケーションを実行するという理由で、すべてのサーバーが存在します。インフラストラクチャグループが物事を変更したり、自分の意志でサーバーを動揺させたりする言い訳はありません。

重大なハードウェア障害への対応は例外かもしれません。

必要なソフトウェアとOSの更新は、スケジュールされたメンテナンスウィンドウと承認された変更プロセスを通じて処理されます。

Nagiosのアイデアも気に入っています。コミュニケーションツールのようなものをセットアップする場合は、Drupalのようなコンテンツ管理システムをお勧めします。

Drupalを内部的に使用して、チーム間で通信します。 1つのチームがサーバーを停止すると、Drupalにイベントが追加されます。残りの人は、メール、RSSアイテム、またはページを更新するだけで取得できます。

BOTH グループに対して変更が送信、承認、スケジュールされる変更管理プロセスを実装します。これにより、誰もが何が起こっているかを知ることができます。このプロセスは、必要に応じて軽量でも重量でもかまいません。

ライセンス: CC-BY-SA帰属
所属していません StackOverflow
scroll top