前言:我们希望扩展对我们的网络商店之一的监视,因为提供商在PHP配置和Live WebShop的一部分崩溃时遇到了麻烦(后端和结帐行不起作用)。我不想在这里讨论有关搬到另一个提供商的问题。

当我们现在正在考虑监视网络商店本身和某些部分的可用性的可能性(例如“结帐工作吗?”),问题是:

您建议哪些工具和策略监视实时网站?

一些想法:

  • 您是否会自动检查结帐是否仍在实时网站上工作?
  • 有什么可以监视以检测故障的好参数?最后订单<1天前,最后一个用户登录,...
  • 使用CRON作业:例如,检查最后订单日期/时间是否太久,请发送电子邮件和/或手动检查结帐是否仍然有效?
  • 使用ICINGA,UPTIME机器人等软件/工具,...
  • 向管理员发送警告电子邮件,...

期待您的答案:)

有帮助吗?

解决方案

您可以自动执行几件事。

  1. 如果商店的部分停止工作 单位测试 是检测某些功能是否仍在工作的好方法。
  2. 为了测试前端我使用 phpquery 在远程服务器上,以定期查找某些关键页面上的某些DOM元素,例如“类别列表中仍然存在产品”,“在主页上有页脚*,等等
  3. 设置一个简单的cronjob,可以使您的主机看是否仍然可用
  4. 使用本地的Magento订单RSS feed检查订单是否仍在进行。在高级交通商店,在星期五晚上没有一个小时的订单,这是一个很好的指示::)
  5. 监视您的付款服务提供商。在荷兰,我们使用理想的方式来处理付款。 这个网站 显示其正常运行时间,您的PSP可能会提供类似的服务

*如果页面上没有页脚,可以指向PHP错误停止渲染。

这些是我们使用的几个解决方案。他们只需要一些设置时间,并且可以免费运行。

顺便说一句,我真的很期待所有答案!

其他提示

我将在桑德(Sander)的奇妙答案中吻合以下内容,该答案假设您已经设置并使用像Pingdom这样的监视服务*:

  • 注意页面上的内容; 通常 关闭 </html> 标签。我看过很多 before_body_end 脚本失败了第三方(未接收的例外等),这些脚本对最终用户看不见,但返回500个状态 - 对于SEO / Google / Google / Google /网站管理员工具非常糟糕
  • 设置网站管理员工具以通知您,当错误增加超过一定阈值
  • 在页面上设置无效SSL的警报
  • 在页面上设置JavaScript错误的警报
  • 使用电子邮件组/BCC进行付款失败的电子邮件,错误报告。
  • 与您的呼叫中心人员保持紧密联系,并确保他们知道如何屏幕截图问题 - 通常是第一个指出出现问题时的人。
  • 一个慢速的站点与倒塌站点一样糟糕。确保您的警报对您的网站何时花费时间比平常更长的时间很敏感。
  • 订阅所有关键第三方 /托管服务的Twitter提要。较大的主机通常会在存在问题时具有Twitter触发器。您可以在某些帐户发布时将Twitter配置为电子邮件/发短信。

DevOps:

  • 设置用于监视关键系统并发送警报的Nagios
  • 设置Syslog或Splunk(免费到某个查询/天的#)以汇总日志并根据日志数据发布警报
  • 配置网络设备的脚本例行检查。我(在不止一次的情况下)NICS回去,从1GB降至10MB,对我们不知道。

对于大型团队:

  • 设置CI服务器(Travis,Jenkins/Hudson,Capistrano),以警告您提交后潜在的失败测试。
  • 在您的源控件中设置预密码挂钩以执行代码标准或检查公然问题,例如损坏的代码
  • 就像桑德所说的那样,设置一些用于监视RSS供稿的订单和数量的一些东西 - 这里的好处是,它是没有缓解的,通常如果您设置了足够低的通知阈值,那么潜在的问题就会立即绊倒。
  • 使用硒。很多。已经进行了脚本测试,这些测试每小时或两个小时进行结帐过程。
  • 设置日历提醒和SSL到期的特定警报

您将生成大量数据和潜在的误报;不要免受警报的影响。


我不隶属于pingdom。我只是喜欢他们的(免费)产品。

如果您只有寄宿生的问题而不是付款问题,则可以考虑设置隐藏的产品,请写下硒测试,将其放入购物车中,添加优惠券以使其免费,然后再进行结帐。

这里已经有一些很好的答案,具体取决于您的设置。我使用NewRelic监视服务器和交易统计数据,并为结帐过程的每个步骤设置关键交易。这样,我可以查看手机上的一个屏幕,并确定我们是否仍在整个过程中获得适当数量的人进行检查,以及他们是否得到适当的响应时间。如果我在最后一步上看到一堆吞吐量,我知道PayPal可能会破坏,因为没有人能够处理他们的卡片。如果有很多错误,响应时间已关闭等,我也会得到警报。您严格不需要Newrelic来执行此操作,但是它非常简单,很快就可以建立,我没有时间构建我自己的仪表板/应用程序/警报系统。

我喜欢Newrelic和Pagerduty,如果您的网站或网站的任何部分都关闭,它们简直是完美的,并在一分钟内通知您(电子邮件,文本和呼叫)。它甚至可以通知您的CPU或内存是否超出了制作网站无响应的指定百分比。

  • 设置新遗物,并使用您要监视和监视频率的所有页面。示例:主页,任何1个类别页面,任何1个产品页面,购物车页面,结帐页面等。
  • 添加用户(所有收到通知),日程安排(您喜欢收到通知的日子和时间),服务(新的Relic Alerts)以及您想要的通知类型(电子邮件,电子邮件,拨打电话,呼叫)

https://www.pagerduty.com/docs/guides/new-relic-integration-guide/

免责声明:我不隶属于上述任何服务。

杂志 - https://github.com/magento-hackathon/hackathon_magemonitoring 出色的免费开源工具跟踪服务器和Magento Health,发送带有异常和系统日志的电子邮件。

  • 在提供商方面的Munin获得所有服务器(LB,App,DB,Redis等)和所有服务(内存,加载,IO等)的历史价值
  • Nagios/icinga在提供商或本地方面,用于所有服务器上的实时监控负载
  • pingdom收集“重要” URL的响应时间,例如首页,结帐等。
  • 用于真实用户监视的pingdom,您将获得类似于APDEX的值,并查看历史发展
  • pingdom检查URL及其正确的内容
  • 在自动重新加载模式下使用最后X订单报告。有了它,我可以看到可能的休息
  • 在相同的舞台系统上使用硒进行自动测试。我不是现场系统上自动结帐的朋友。稍后您会遇到会计问题:)
  • Zapier和Twilio for Email2Sms。关键错误被以短信发送到电话
  • Freeboard.io和Dweet.io在不错的仪表板上显示所有内容。
许可以下: CC-BY-SA归因
scroll top