这可能是一个非常高级别的问题,需要很多解释,但我需要很多解释。

基本上我正在开发一个需要大量日志记录和跟踪的PHP应用程序。跟踪点击,交互,性能等等。在阳光下的任何东西。Facebook的Scribe和Yahoo的Chukwa都是很大的实现。我很少了解log4php。

我想要的是这种日志记录如何工作的高级概述,具体与PHP应用程序一起使用。您可以在日志处理的点处停止;我已经知道我想使用Hadoop / Hive进行处理和存储。

我还希望一些相当低的级别看应用程序本身内会发生什么。例如,人们如何采取点击的行为并将其发送到记录器?我很欣赏任何可以帮助我开始的读数。

有帮助吗?

解决方案

您可以购买/获取工具来为您服务或在内部构建。

购买/获得:

1 - 使用Google / Yahoo Analytics标记页面 - 这将跟踪PageViews,页面流性能,SEO排名为关键字等。

2 - 用于跟踪和记录用户行为,包括单击,交互和性能。我发现比Clicktale更好 - http://www.clicktale.com/default_e.aspx - IT视频记录用户会话并将这些“日志文件”放在服务器中。

内部: 1 - 在表单中创建提交给日志记录数据库的隐藏字段也有效。您可以在提交期间指定唯一的ID,以表格和跟踪IT的操作。

我确定更多,但这些是基础知识。这些不是特定的PHP。

hth

编辑#1:

这可能超出您的问题的范围,但跟踪并不一定意味着内部的数据。一个例子将添加“喜欢它”或“Digg It”按钮到文章或页面。这将“记录”您的流行度。您可以转到Facebook或Digg.com查看您的网站的进度。它也会有助于SEO。基本上,这是一个跟踪系统。它很容易使用。您可以在那里进行PHP片段,您可以复制和粘贴到您的代码。如果您有WordPress,则存在一个插件 - 只需查找“Digg”,在插件搜索部分中“喜欢它”。

返回Google Analytics,如果您想超越跟踪点击,请继续并进行目标/漏斗。它会跟踪用户行为,并回答“我最有价值的关键字是什么?” “我的用户在哪里脱落?” “每个页面的反弹率是多少?” “我网站和流量媒体的前3名入口点是什么?”这些问题是SEO / SEM管理人员最关心的问题。跟踪和理解这绝对是好的。

clicktale启动Google Analytics结束的位置。 GA将在页面级别中描述用户行为,但不在字段级别。 Clicktale,它有热图,将回答这些问题“我知道这个页面有很高的弹跳率,但为什么?哪个字段是我的客户的问题字段?” “在页面的哪个地区,用户将大部分时间花在?” “如何证明到图形家伙需要重新设计的特定部分?”

编辑#2

对于高流量站点,您需要缩放日志记录数据库。它真的有助于报告。我建议的是3层数据库报告结构。 1=最后7天,第2层=最后6个月,=一切。您可以根据业务修改这些。点是,数据从一个层移动到另一个层。保持新的数据随时可用。您要尽快生成报告。一个巨大的db只是不扩展。

其他提示

您可以通过记录用户正在拍摄的路径,引荐 - >新URI来监视用户单击,假设两者都是冗长的。例如,如果用户点击他的一个朋友,您应该记录URI:

Referrer: /users/41251
Target: /users/66257
.

适当地存储,以便轻松查询和报告。在这里,像这样的直接点击,假设目标是在推荐人的页面中,所以是朋友。如果您有更复杂的情况,请务必使用不同的URI描述它们,例如:建议连接的/users/suggestion/14152

添加到该时间戳,并且您对每个页面留下的时间非常粗略估计,尽管用户往往失去焦点,切换选项卡/应用程序并返回等等。谷歌分析,为一个,这效果很好。

在用户使用Heatmaps我喜欢的网站上的摘要,我喜欢免费(gpl)单击

签出 splunk

在您正在进行日志的前端,这里有一些您可能会发现的一些示例PHP代码:

http://www.alphadevx.com/ a / 85-logging-messages-to-scribe-from-php

在架构方面,您对抄写员有很多灵活性。我建议在每个应用程序节点上运行本地抄写实例,并将应用程序在本地登录到localhost。这些本地划线实例又可以配置为在不太繁忙的情况下将其日志记录到中央划线服务器,否则它们将继续在本地队列释放消息。您实际上会在中央服务器上使用类别汇总的日志。

我是抄写员的忠实粉丝,我认为它的设计很好,就像它有一个非常小的内存和处理器足迹,它很容易配置(虽然谋杀由于依赖性而安装!) 。它只是缺乏文件。

许可以下: CC-BY-SA归因
不隶属于 StackOverflow
scroll top