Domanda

Io sono interessante nel algoritmo di Google AdSense bot e il comportamento con il sito web. Non ho lavorato con AdSense e non ho conto. Quindi ho bisogno del vostro aiuto per capire:

1) Gbot di volta in volta scarica tutte le pagine dal sito web. Ho ragione?

2) Gbot non capiscono contenuti dinamici (caricato da ajax). Quindi devo generare contenuti statici e restituirlo entro pagina html e queste pagine devono mostrare il contenuto identico per tutti gli utenti e per Gbot?

3) A causa di (1) e (2) Non posso usare solo percorso principale http://example.com con alcuni widget di "principale". Devo generare pagine uniche per esempio http://example.com/thread?id=101 ?

4) Gbot download di pagine (1) per afferrare (indicizzazione) parole chiave da loro e poi negozio (su di essa la server) queste informazioni ad esempio chiave / valore (dove chiave è percorso pagina, il valore è tag cloud). Ho ragione?

5) Quando sito web e 'stato aperto in browser dell'utente. carichi di codice del HTML integrato AdSense alcuni javascript. Mi pare di capire da "googling" questa JavaScript non fare pagina di indice, ma fa la chiamata (con qualche chiave parametro page_path ==) al server di Google e ottiene adeguati collegamenti di annunci. Poi mostra questo link pubblicitari in esso del telaio. E 'un comportamento giusto? Forse JavaScript rende alcuni indicizzazione locale dei contenuti di pagina?

6) Come Gbot e AdSense di lavoro JavaScript con i biscotti? Mi pare di capire AdSense può utilizzare i cookie per lo show di adeguati collegamenti di annunci. Se è giusto, per favore mi dia alcuni casi d'uso;)

Lo so che "vero" algoritmo è conosciuto solo da ingegneri di Google. Ma alcuni di voi hanno avuto esperienza con AdSense e AdSense HTML / JavaScript. Si prega di correggere la mia visione di esso;)

La ringrazio molto per qualsiasi consiglio !!!

P.S. Questa domanda è molto importante per me. E non è una domanda per il divertimento! Quindi per favore non chiuderlo;)

È stato utile?

Soluzione

1) Sì se Googlebot può accedere alle pagine e se si conosce circa le pagine attraverso un link, XMLSitemaps, Google +1, ecc.

2) Googlebot sarà ora rendere AJAX / XHR richiede di comprendere il contenuto AJAX (http://googlewebmastercentral.blogspot.com/2011/11/get-post-and-safely-surfacing-more-of.html).

Sì, si dovrebbe mostrare lo stesso contenuto a Googlebot come si farebbe utenti, altrimenti questo sarebbe in considerazione di occultamento, che è contro le loro linee guida.

3) Questa domanda non è chiara. Ma in fondo è preferibile avere il cambiamento URL perché Google sarà quindi sapere come indicizzare il contenuto separatamente. Se stai usando AJAX allora si potrebbe prendere in considerazione permalink come da te suggerito, oppure è possibile utilizzare HTML5 popstate.

4) Si Google indice di volontà le parole sulla pagina. Io non sono certo che memorizzano come una coppia chiave / valore. Io non sono nemmeno sicuro se stanno ancora utilizzando Big Table (http://labs.google.com/papers/bigtable.html) ... ma è probabile che usano Big Table o un sistema simile per memorizzare l'indice invertito .

5) il codice AdSense è integrato JavaScript ... per le nuove pagine web che Google non ha mai visto prima, cerca di fornire il maggior numero di annunci pertinenti in base alle informazioni è trovato sul web sul sito o, eventualmente, attraverso il testo di ancoraggio di link che puntano a quella pagina. Tuttavia, per ottenere una comprensione più accurata del contenuto della pagina, Google invierà un bot adsense specifiche di scansione del tuo pagina ... a volte si vedrà venire molto veloce, anche non appena si carica la pagina per la prima tempo. Esso utilizza un agente utente diverso da quello tradizionale Googlebot ... si possono trovare tutti gli agenti utente da Google qui (http://www.google.com/support/webmasters/bin/answer.py?answer=1061943)

6) crawler di Google non accettano i cookie e non passeranno di nuovo cookie al server. Ha a che fare con la natura in maniera massiccia distribuita dei crawler di Google che ti fa mantenere i cookie o sessioni estremamente difficile.

Autorizzato sotto: CC-BY-SA insieme a attribuzione
Non affiliato a StackOverflow
scroll top