Каковы хорошие способы мониторинга живого магазина?
-
16-10-2019 - |
Вопрос
Предисловие:Мы хотим расширить мониторинг одного из наших интернет-магазинов, поскольку у провайдера возникли проблемы с настройкой PHP, а некоторые части работающего интернет-магазина вышли из строя (серверная часть и оформление заказа не работают).Я не хочу здесь обсуждать переход к другому провайдеру.
Поскольку мы сейчас думаем о возможности мониторинга самого интернет-магазина и доступности определенных частей (например, «Работает ли касса?»), Вопрос в следующем:
Какие инструменты и стратегии вы предлагаете для мониторинга работающего веб-сайта?
Некоторые идеи:
- Вы автоматически проверяете, работает ли касса на действующем веб-сайте?
- Какие параметры следует отслеживать для обнаружения сбоев?Последний заказ < 1 дня назад, последний вход пользователя,...
- Использование заданий cron:Проверяете, например, дату/время последнего заказа и, если это произошло слишком давно, отправить электронное письмо и/или проверить вручную, работает ли оформление заказа?
- Использование программного обеспечения/инструментов, таких как Icinga, Uptime Robot и т. д.
- Отправка предупреждающих писем администраторам...
Ждем ваших ответов :)
Решение
Есть несколько вещей, которые вы могли бы сделать автоматизировать.
- Если части магазина перестаньте работать Модульные тесты Хороший способ обнаружить, работают ли определенные функции.
- Чтобы проверить фронт, я использую Phpquery На удаленном сервере для периодического поиска определенных элементов DOM на определенных страницах ключевых страниц, таких как «есть ли продукты в списке категорий», «Есть ли нижний колонтитул* на домашней странице» и т. Д.
- Установите простой Cronjob, который пинвает вашего хозяина, чтобы увидеть, если он все еще доступен
- Используйте Native Magento Заказ RSS -канал, чтобы проверить, есть ли заказы все еще приходится. В магазинах с высоким движением нет заказов на час в пятницу вечером, является хорошим показателем того, что что -то не так :)
- Следите за поставщиком платежей. В Нидерландах мы используем идеально для обработки платежей. Этот сайт Отображает свое время безотказной работы, ваш PSP может предоставить аналогичный сервис
*Если на странице нет нижнего колонтитула, которая может указывать на ошибку PHP, останавливающую рендеринг.
Это пара решений, которые мы используем. Им просто нужно некоторое время настройки, и они могут свободно работать.
Кстати, отличный вопрос, я действительно с нетерпением жду всех ответов!
Другие советы
Я приведу следующий фантастический ответ Сандера, в котором предполагается, что вы настроили и используете службу мониторинга, такую как Pingdom *:
- Следите за контентом на странице; обычно закрытие
</html>
ярлык.Я видел так многоbefore_body_end
сценарии терпят неудачу со сторонними приложениями (неперехваченные исключения и т. д.), которые невидимы для конечных пользователей, но возвращают статус 500 — очень плохо для инструментов SEO/Google/веб-мастеров. - Настройте Инструменты для веб-мастеров, чтобы они уведомляли вас, когда количество ошибок превышает определенный порог.
- Настройте оповещения о недействительном SSL на странице.
- Настройте оповещения об ошибках JavaScript на странице.
- Используйте группы электронной почты/скрытую копию для электронных писем с неудачными платежами и отчетов об ошибках.
- Свяжитесь с сотрудниками вашего колл-центра и убедитесь, что они знают, как выявить проблемы со снимками экрана — обычно они первыми указывают, когда что-то идет не так.
- Медленный сайт так же плох, как и неработающий сайт.Убедитесь, что ваши оповещения чувствительны к тому, когда ваш сайт загружается дольше, чем обычно.
- Подпишитесь на каналы Твиттера для всех ваших ключевых сторонних/размещенных сервисов.На крупных хостингах обычно есть триггеры Twitter на случай возникновения проблем.Вы можете настроить Twitter отправлять вам электронные письма/текстовые сообщения, когда определенные учетные записи публикуют сообщения.
Девопсы:
- Настройте Nagios для мониторинга критически важных систем и отправки оповещений.
- Настройте системный журнал или Splunk (бесплатно до определенного количества запросов в день) для агрегирования журналов и выдачи предупреждений на основе данных журналов.
- Настройте регулярную проверку вашего сетевого оборудования по сценарию.Я видел (не раз), как сетевые карты возвращались и уменьшались с 1 ГБ до 10 МБ без нашего ведома.
Для больших команд:
- Настройте CI-сервер (Трэвис, Дженкинс/Хадсон, Капистрано), чтобы предупреждать вас о потенциальных неудачных тестах после коммитов.
- Настройте перехватчики предварительной фиксации в системе управления версиями, чтобы обеспечить соблюдение стандартов кода или проверить наличие явных проблем, таких как неработающий код.
- Как сказал Сандер, настройте что-нибудь для мониторинга RSS-каналов на предмет заказов и объема по времени суток — преимущество здесь в том, что они не кэшируются, и обычно, если вы устанавливаете достаточно низкий порог уведомления, потенциальная проблема немедленно вызовет это.
- Используйте Селен.МНОГО.Запланируйте тесты, которые будут проходить через процесс оформления заказа каждые час или два.
- Настройте напоминания в календаре и специальные оповещения об истечении срока действия SSL.
Вы собираетесь генерировать МНОГО данных и потенциально ложных срабатываний;не становитесь невосприимчивыми к предупреждениям.
Я не связан с Pingdom.Мне просто нравится их (бесплатный) продукт.
Если у вас есть проблемы только с вашим хостером, а не с платежей, вы можете подумать о настройке продукта, который скрыт, напишите селен-тест, положив его в корзину, добавьте купон, чтобы сделать его бесплатным, а затем пройти через кассу.
Здесь уже есть несколько замечательных ответов, в зависимости от вашей настройки. Я использую NewRelic для мониторинга статистики сервера и транзакций, а также настройку ключевых транзакций для каждого шага процесса оформления. Таким образом, я могу посмотреть на один экран на своем телефоне и определить, получаем ли мы все еще соответствующее количество людей, проверяющих весь процесс, и получают ли они подходящее время отклика. Если я вижу кучу пропускной способности на всем до последнего шага, я знаю, что PayPal, вероятно, сломан, поскольку никто не может обрабатывать свои карты. Я также получаю оповещения, если есть много ошибок, время отклика отключено и т. Д. ... вам не нужна новичка, чтобы сделать это, но это очень просто и быстро настроить, и у меня не было времени, чтобы построить моя собственная панель/приложение/система оповещения.
Мне нравится Newrelic и Pagerduty для этого, они просто идеальны и уведомляют вас (электронная почта, текст и звонок) через минуту, если ваш сайт или какая -либо часть вашего сайта не падает. Он даже уведомляет, выходит ли ваш процессор или память за пределы указанного процента использования сайта без реагирования.
- Настройка новой реликвии со всеми страницами, которые вы хотите контролировать и контролировать частоту. Пример: домашняя страница, любая страница 1 категории, любая страница 1 продукта, страница корзины, страница оформления заказа и т. Д.
- Добавьте пользователей (кто все получает уведомления), расписания (день и время, когда вы предпочитаете получать уведомления), услуги (новые оповещения обмена) и политики эскалации по предупреждениям Pagerduty и типам уведомлений, которые вы хотите (электронная почта, текст, звонок)
https://www.pagerduty.com/docs/guides/new-reelic-integration-guide/
Отказ от ответственности: я не связан ни с одной из вышеперечисленных услуг.
Magemonitoring - https://github.com/magento-hackathon/hackathon_magemonitoring Отличный бесплатный инструмент с открытым исходным кодом, который отслеживает сервер и Magento Health, отправляйте электронные письма с исключениями, системными журналами и т. Д.
- Мунин на стороне поставщика, чтобы получить исторические значения для всех серверов (LB, APP, DB, REDIS и т. Д.) И все услуги (память, нагрузка, IO и т. Д.)
- Нагиос/Icinga на поставщике или на местной стороне для почти живой нагрузки на все серверы на всех серверах
- Pingdom, чтобы собрать время отклика для «важных» URL -адресов, таких как первая страница, проверка и т. Д.
- Pingdom для реального мониторинга пользователей, вы получаете ценность, аналогичное APDEX, и видите историческое развитие
- Пингдод проверить URL -адреса и их правильный контент
- Отчетность с последними x заказы в режиме автоматической перезагрузки. С этим я вижу возможные перерывы
- Автоматизированные тесты с селенами на идентичной сценической системе. Я не друг автоматизированных зачетов в моей живой системе. Позже вы получите проблемы со своим бухгалтерским учетом :)
- Zapier и Twilio для электронной почты2SMS. Критические ошибки отправляются в виде SMS на телефон
- Freebarge.io и dweet.io, чтобы отобразить все на хорошей панели приборной панели.