Question

C'est probablement à un niveau assez élevé de la question qui exige beaucoup de leur expliquer, mais je suis dans le besoin de beaucoup d'explication.

En gros je suis le développement d'une application PHP qui nécessite beaucoup de journalisation et de suivi.Le suivi des clics, interactions, performance, etc.etc.Rien de nouveau sous le soleil.Facebook du Scribe et de Yahoo Chukwa sont à la fois un grand implémentations de cette.Je sais peu de choses sur log4php.

Ce que je veux, c'est un aperçu de haut niveau de la façon dont ce type d'enregistrement fonctionne, plus précisément en conjonction avec une application en PHP.Vous pouvez vous arrêter au point où le journal est traitée;Je sais déjà que je veux utiliser Hadoop/Ruche, de traitement et de stockage.

J'aimerais aussi quelques-uns assez bas niveau regarde ce qui se passe à l'intérieur de l'application elle-même.Par exemple, comment peut-on prendre le comportement d'un clic et l'envoyer à l'enregistreur de données?J'apprécierais toute lecture qui peut aider à me faire ainsi.

Était-ce utile?

La solution

Vous pouvez acheter / obtenir les outils pour le faire pour vous ou construire en interne.

acheter / obtenir:

1 - Étiquetez vos pages avec Google / Yahoo Analytics - cela suivra les pagesViews, les performances de flux de page, le classement des références pour les mots-clés, etc.

2 - Pour le suivi et la journalisation Comportement de l'utilisateur, qui incluent des clics, des interactions et des performances. Je n'ai rien trouvé mieux que Clicktale - http://www.clicktale.com/default_f.aspx - IT vidéo enregistre des sessions utilisateur et met ces "fichiers journaux" dans un serveur.

en interne: 1 - Création de champs cachés dans vos formulaires qui soumet une base de données de journalisation fonctionne également. Vous spécifiez des identifiants uniques aux formulaires et de garder une trace de ses actions pendant les soumissions.

Je suis sûr qu'il y a beaucoup plus, mais ce sont les bases. Ce ne sont pas spécifiques PHP cependant.

htth

Edit # 1:

Cela peut dépasser la portée de votre question, mais le suivi ne signifie pas nécessairement des données qui vont à la maison. Un exemple d'ajout d'un bouton "J'aime" ou "Digg IT" à des articles ou des pages. Cela «enregistrera» la popularité pour vous. Vous pouvez aller sur Facebook ou Digg.com pour voir les progrès de votre site. Ça va également aider avec le référencement. Fondamentalement, c'est un système de suivi. Et il est facile à utiliser. Il existe des extraits de PHP que vous pouvez copier et coller sur votre code. Si vous avez WordPress, il existe un plugin - il suffit de rechercher "Digg", "J'aime" dans la section Recherche de plug-in.

retour à Google Analytics, si vous voulez aller au-delà des clics de suivi, allez-y et faites des buts / des entonnoirs. Il va suivre le comportement des utilisateurs et répondre à des questions telles que "Quels sont mes mots-clés les plus précieux?" "Où sont tous mes utilisateurs qui tombent?" "Quel est le taux de rebond pour chaque page?" "Quels sont les 3 principaux points d'entrée sur mon site et de quel support de circulation?" Ce sont des questions de référencement des référenciers / SEM sont les plus préoccupés. Et c'est certainement bon à suivre et à comprendre.

ClickTale démarre où se termine Google Analytics. GA décrira le comportement des utilisateurs dans le niveau de la page, mais pas sur le terrain. Clicktale, qui a des cartes thermiques, répondra à ces questions "Je sais que cette page a un taux de rebond élevé, mais pourquoi? Quel champ est un champ problématique pour mes clients?" "Dans quelle zone de la page les utilisateurs passent la plus grande de leur temps?" "Comment puis-je prouver aux gars des graphismes qu'une section particulière doit être repensée?".

Edit # 2

Pour les sites de trafic élevés, vous devrez évoluer votre DB de journalisation. Cela aide vraiment quand il s'agit de rapporter. Ce que je suggère, c'est une structure de reporting de base de données de 3 niveaux. Tier 1= 7 derniers jours, Tier 2= 6 derniers mois, Tier= tout. Vous pouvez les modifier en fonction de l'entreprise. Le point d'être, les données se déplacent d'un niveau à un autre. garder les données fraîches facilement disponibles. Vous souhaitez générer des rapports dès que possible. Un seul énorme dB ne fait que l'échelle.

Autres conseils

Vous pouvez surveiller l'utilisateur clique en vous connectant le chemin d'accès de l'utilisateur est prise, référent --> new uri, en supposant que les deux sont prolixes et suffisamment descriptif.Par exemple, si un utilisateur clique sur l'un de ses amis, vous devez vous connecter à l'uri:

Referrer: /users/41251
Target: /users/66257

les stocker correctement pour faciliter l'interrogation et de reporting.Ici, un clic direct comme ça suppose que la cible est dans le référent de la page, donc, est un ami.Si vous avez des scénarios plus complexes assurez-vous de les décrire avec des uri, par exemple: /users/suggestion/14152 pour une connexion proposées.

Ajoutez à cela les horodatages et vous avez une estimation très approximative de combien de temps ils sont restés sur chaque page, bien que les utilisateurs ont tendance à perdre le focus, changer d'onglet/applications et de revenir, etc.Google Analytics, pour l'un, est-ce bien.

Pour un résumé de l'endroit où les utilisateurs cliquent plus sur votre site à l'aide de cartes de chaleur j'aime le libre (GPL) Clickheat.

Vérifiez Splunk

sur le fronchon où vous faites la journalisation, voici quelques échantillons de code PHP que vous pourriez trouver utiles:

http://www.alphadevx.com/ A / 85-Logging-Messages-to-scribe-de-php

En termes d'architecture, vous avez beaucoup de flexibilité avec le scribe. Je vous recommanderais d'avoir une instance de scribe locale exécutée sur chaque nœud d'application et que votre journal d'application localement à localhost. Ces instances de scribe local peuvent à son tour être configurées pour se connecter à un serveur de scribe central lorsqu'il n'est pas trop occupé, sinon ils continueront à faire la queue des messages localement. Vous consommez effectivement vos journaux sur le serveur central où ils sont agrégés par catégorie.

Je suis un grand fan de Scribe, et je pense qu'il est bien conçu, c'est jusqu'à avoir une très petite empreinte de mémoire et de processeur, et il est assez facile de configurer (bien que le meurtre soit installé en raison des dépendances!) . Il manque juste de la documentation.

Licencié sous: CC-BY-SA avec attribution
Non affilié à StackOverflow
scroll top