Вопрос

Любопытно, что ДЕЙСТВИТЕЛЬНО означает безотказную работу 99,95%;Действительно ли оно будет сокращаться на 7 минут в месяц?Пожалуйста, опубликуйте свое самое продолжительное/среднее время безотказной работы на EC2, спасибо.

Это было полезно?

Решение

Обычно время безотказной работы рассчитывается ежегодно.Итак, если у вас есть Соглашение об уровне обслуживания на 99,95%, это означает:

365 * 0.0005 = 0.1825 days or 4.38 hours

Если в течение года обслуживания произойдет сбой и ваша система выйдет из строя более чем на это время, вы несете ответственность за компенсацию.

Что касается вашего вопроса, у меня есть сервер, работающий без остановки в EC2 уже около 3 месяцев.Я бы сказал, что время их безотказной работы хорошее, но если у вас есть критически важное приложение, вам обязательно нужно иметь решение для аварийного переключения.Хорошее время безотказной работы означает лишь то, что они смогут быстро отреагировать на сбой.Даже бесперебойная работа на уровне 99,9999% не сможет вас спасти, если вы не готовы к сбоям.

Другие советы

Внимательно прочтите SLA (http://aws.amazon.com/ec2-sla/) они считают простоем только «Регион недоступен», и, более того, они считают его простоем только в том случае, если регион недоступен в течение 5 минут подряд.

«Годовой процент работоспособности» рассчитывается путем вычитания из 100 % процента 5-минутных периодов в течение года обслуживания, в течение которых Amazon EC2 находился в состоянии «Регион недоступен».

По моим подсчетам, это означает, что любой простой длительностью менее 4 минут не учитывается.Кроме того, если они нарушат соглашение об уровне обслуживания, они будут наказаны только в течение 10 % от месяца, в котором у вас был самый большой счет за простой.Поэтому, если они не работали весь январь и ваш счет составил 100 долларов, они начислили бы на ваш счет кредит в размере 10 долларов.

Мне было бы трудно убедить своего начальника, что это серьезный продукт с таким SLA.

SLA бесполезны.Они лишь измеряют, какой риск готова взять на себя компания, и не влияют на фактическое время безотказной работы.Я видел соглашения об уровне обслуживания с большими штрафами, которые предлагались, когда компания знала, что не может выполнить условия соглашения об уровне обслуживания, чтобы осуществить продажу.

У меня есть один клиент с более чем 400 днями бесперебойной работы EC2, а другой — с более чем 300 днями, если судить по веб-пульсу. Это, безусловно, самый надежный сервис, с которым я работал.

Для моего единственного экземпляра, работающего в зоне доступности «Восток США», 9 месяцев, 0 простоев.

С тех пор, как Amazon перешла на предоставление соглашения об уровне обслуживания, у меня ни разу не вышло из строя ни одного экземпляра.Когда в прошлом у меня случались отключения инстансов, Amazon всегда отправлял мне сообщение, информирующее меня о том, что качество инстанса ухудшилось, прежде чем оно фактически исчезло, поэтому у меня было время запустить новый инстанс.

Однако предыдущий ответ содержит в себе хороший момент;Модель обслуживания EC2 требует, чтобы вы писали свои приложения для обработки аварийного переключения на новый сервер, если вы не готовы к длительному простою.

conrad@papa ~ $ uptime
 04:42:36 up 495 days,  8:51,  8 users,  load average: 0.02, 0.02, 0.00

Проверка Панель мониторинга состояния сервисов AWS даст вам хорошее представление о любых текущих или прошлых проблемах.Мой опыт показывает, что время безотказной работы AWS лучше, чем у большинства «традиционных» вариантов хостинга (даже с полномасштабной избыточной установкой RackSpace...).

Однако просто использовать AWS для обеспечения бесперебойной работы — это все равно, что купить машину на связке для ключей (ну, почти…;)).Большим преимуществом архитектуры, использующей AWS, является масштабирование (без первоначальных затрат).

Соглашение об уровне обслуживания...Гарантированная работоспособность...

Это все очень хорошие слоганы.Но когда серверы недоступны в течение часа (1 марта 2012 года в регионе ЕС) и клиенты начинают звонить, то вам не поможет то, что у них все еще есть 300-дневный аптайм.

А когда молния ударила в 1 из 3 их дата-центров в ЕС, мы все обнаружили, что у них нет внешних резервов, и тот факт, что у них 3 дата-центра, ни о чем не говорит.

Надо любить фразу «пониженная производительность», которая на самом деле означает:«Скрестите пальцы и молитесь, чтобы ваши данные были доступны после катастрофы».

Я все еще пытаюсь найти официальную/неофициальную статистику о процентах доступности всех их центров обработки данных.

Пока не повезло...

Лицензировано под: CC-BY-SA с атрибуция
Не связан с StackOverflow
scroll top