Разумное время простоя
-
10-07-2019 - |
Вопрос
У меня около 5 различных размещенных серверов через разных хостинг-провайдеров.За последние два месяца один из серверов, на которых я работаю, дважды выходил из строя.Оба раза были неожиданными и довольно долгими (36 часов и 4 часа).Рассматриваемый сервер является VPS, а не общим сервером.Учитывая мой опыт работы с другими моими серверами/провайдерами (как VPS, так и общими), это кажется неприемлемым количеством простоев.
- Что вы думаете?
- Какое время простоя ваших серверов (плановое и внеплановое) вы считаете разумным?
Решение
Ты получаешь то, за что платишь.
Каков ваш SLA с вашим провайдером?У вас вообще есть такой?Если и есть какой-то фактор, объясняющий разницу в цене, так это вот этот.Если вам нужно гарантированное время безотказной работы (например, 3 девятки), вам придется за это заплатить.Например, время безотказной работы 5 девяток обойдется вам значительно дороже.
Чтобы ответить на ваш вопрос:Вы получили объяснение причин этого простоя?36 часов — это слишком долго.4 часа не обязательно (если это редкость).Была ли это аппаратная неисправность?Если да, то вы ничего не можете с этим поделать.Когда-то у меня был провайдер, который время от времени давал сбои. их config и почта перестанут работать, пока я не скажу им это исправить.Для меня это было неприемлемо.
Другие советы
Серверное оборудование выйдет из строя.Это только вопрос времени.Вместо того, чтобы пытаться определить, что разумно, я бы задал вам другой вопрос:Каковы все возможные причины сбоя вашей конфигурации и готовы ли вы изменить ее, чтобы учесть эти возможности?
Например, предположим, что ваш сайт размещен на одном VPS.Вот несколько примеров неудач:
- VPS может стать поврежденным
- Гипервизор может выйти из строя
- Сетевое оборудование в шкафу может выйти из строя
- В центре обработки данных могут возникнуть проблемы с электроэнергией/теплом
- Магистральное подключение к Интернету может упасть.
Вы можете снизить риск закрытия вашего сайта №1 и №2, развернув балансировщик нагрузки и второй VPS.Стоит ли это снижение риска дополнительных затрат?
В какой-то момент эта дискуссия превращается в вопрос аварийного восстановления.