Поддержание связи между приложениями и инфраструктурой

StackOverflow https://stackoverflow.com/questions/636123

Вопрос

Я работаю в ИТ-отделе, который разделен на две группы.Одна группа разрабатывает и управляет приложениями, другая управляет инфраструктурой и серверами компании.Одна из проблем, с которыми мы сталкиваемся, — это нарушение коммуникации.Я работаю в группе приложений, и одна из моих проблем заключается в том, что меня не уведомляют, когда сервер отключается инфраструктурой или обновляется база данных.

Есть ли у кого-нибудь предложения о том, как улучшить связь между двумя группами, или какие-либо идеи о том, как вести легкий журнал в нескольких системах (как Linux, так и Windows)?В идеале было бы неплохо, если бы наши ящики могли просто твитнуть свои статусы или что-то в этом роде.

Спасибо за помощь,

Бен

Это было полезно?

Решение

Чтобы сообщить о состоянии сервера, вы можете поручить нашей группе инфраструктуры настроить систему мониторинга сети, например Нагиос.Это даст каждому участнику вашей группы приложений возможность получить моментальный снимок состояния каждого сервера в системе.Наличие такого статуса неоценимо, когда вы занимаетесь разработкой.

Nagios обеспечивает мониторинг сети, а также позволяет отображать запланированное время простоя определенного сервера в системе.

Еще одна вещь, которую ваша группа могла бы сделать для улучшения взаимодействия с инфраструктурой, — это заставить вашу систему сборки сообщать, какие серверы она в настоящее время использует для создания и тестирования ваших продуктов.

Кроме того, вероятно, хорошей идеей будет организация регулярных встреч между заинтересованными сторонами обеих групп.Если вы все разговариваете друг с другом хотя бы 15 минут в неделю, вы, вероятно, увидите, что количество инцидентов, подобных описанному выше, значительно уменьшится.

Другие советы

Я думаю, что это более серьезная проблема контроля изменений.

У вас должен быть контроль над изменениями аппаратного и программного обеспечения, а также процесс утверждения.

В конечном счете, инфраструктура служит вам: цель ИТ-инфраструктуры — запуск приложений.

В моей нынешней крупной компании, занимающейся финансовыми данными, серверы не тронуты без надлежащего разрешения через группы клиентов и приложений.Это кажется огромной проблемой, но каждый сервер существует по какой-то причине — для достижения определенной бизнес-цели и запуска определенного приложения.У инфраструктурной группы просто нет оправдания тому, чтобы что-то менять или нарушать работу серверов по собственному желанию.

Реакция на критический сбой оборудования может быть исключением.

Необходимые обновления программного обеспечения и ОС обрабатываются посредством планового обслуживания и утвержденного процесса внесения изменений.

Мне тоже нравится идея Nagios.Если вы хотите настроить что-то вроде инструмента коммуникации, я бы порекомендовал систему управления контентом, например Drupal.

Мы используем Drupal внутри компании для общения между командами.Когда одна команда выключает сервер, они добавляют событие в Drupal.Остальные из нас получат его либо по электронной почте, либо через RSS, либо просто обновив страницу.

Внедрить процесс контроля изменений, при котором изменения представляются, утверждаются и планируются для внесения. ОБА группы.Это позволяет всем знать, что происходит.Этот процесс может быть настолько легким или тяжелым, насколько вы хотите.

Лицензировано под: CC-BY-SA с атрибуция
Не связан с StackOverflow
scroll top