Ottenere Sitemap è HTML dallo Strumento per i Webmaster di Google
-
11-07-2019 - |
Domanda
[ Nota per il saggio : passa all'ultimo MODIFICA ]
Ho una sitemap txt molto semplice (chiamata sitemap.txt) che assomiglia a questa:
http://myDomain.com
http://myDomain.com/about.html
http://myDomain.com/faq.html
http://myDomain.com/careers.html
Quando lo carico su strumenti per i webmaster ottengo:
Sitemap è HTML - La tua Sitemap sembra essere una pagina HTML. Utilizza invece un formato di sitemap supportato
Ho provato alcune alternative (come con o senza www) ma senza fortuna.
Qualcuno ha qualche idea?
Qualsiasi aiuto apprezzato!
Modifica :
Ho provato con una sitemap xml e ho ottenuto lo stesso errore, quindi sembra che il server stia servendo tutto come HTML (come suggerisce correttamente ceejayoz). Ora la domanda è ... come posso ottenere il server appspot sul server come semplice testo ?
Modifica
Ok - Mi sono stufato e ho implementato un servlet per servire le mie sitemap (ora sto provando sia con XML che con TXT) esplicitamente come text / plain. Tutto funziona bene se invoco manualmente il servlet ma ottenere comunque Sitemap è HTML. Non so dove sbattere la testa!
Modifica Ho provato a verificare il tipo di contenuto con un plug-in firefox - tutto sembra venire fuori come previsto (sto inserendo l'URL effettivo in modo che le persone possano dare un'occhiata):
http://wokheisandbox.appspot.com/sitemaps/sitemap.txt - > Tipo di contenuto: testo / semplice http://wokheisandbox.appspot.com/sitemaps/sitemap.xml - > ; Tipo di contenuto: application / xml
Con il mio servlet (impostazione esplicita del testo / plain): http://wokheisandbox.appspot.com/wokhei/serveSitemap?fileType=TXT - > Tipo di contenuto: testo / semplice http://wokheisandbox.appspot.com/wokhei/serveSitemap?fileType=XML - > Tipo di contenuto: testo / semplice
Tutto ciò che ottengo dallo strumento per i webmaster è ancora - > Sitemap è HTML .
Modifica :
Penso di aver scoperto il motivo - > Mi sono registrato su google webmaster tools il mio sito come http://mydomain.com ma l'app è ospitata su appspot in http://myapp.appspot.com che è mappato su mydomain.com. Se registro http://myapp.appspot.com tutto funziona bene (sitemap convalidato).
Questa è una buona notizia, ma non è l'ideale perché voglio che mydomain.com sia indicizzato ... hai idea di come superare?
Soluzione
Sembra che il tuo server web stia servendo i file .txt
come text / html
anziché text / plain
.
Per Apache, il seguente in un file .htaccess dovrebbe risolverlo:
AddType text/plain .txt
Altri suggerimenti
Ho trovato questo discutendo voci duplicate che hanno causato recenti dolore mappa del sito . Non vedo questo problema nella tua Sitemap ma non vuoi duplicati tra le voci. Ad esempio, assicurati che la tua Sitemap non contenga ENTRAMBI quanto segue:
http://mydomain.com/ or http://www.mydomain.com/
AND
http://mydomain.com/index.html or http://www.mydomain.com/index.html
Penso che tu abbia pubblicato l'intera Sitemap, quindi, di nuovo, non penso che questo sia esattamente il tuo problema. Hai menzionato di aver provato vari URL (con e senza www.) Se stai convalidando la Sitemap tramite gli Strumenti di Google WebMaster potrebbero essere necessari fino a 20 minuti affinché la correzione abbia effetto. Spero che sia d'aiuto.
<?xml version='1.0' encoding='utf-8' ?>
<urlset xmlns='http://www.sitemaps.org/schemas/sitemap/0.9'>
<url>
<loc>http://myDomain.com</loc>
</url>
<url>
<loc>http://myDomain.com/about.html</loc>
</url>
<url>
<loc>http://myDomain.com/faq.html</loc>
</url>
<url>
<loc>http://myDomain.com/careers.html</loc>
</url>
</urlset>
In questo modo funziona sempre per me.
Nel caso in cui cambiassi idea sulle sitemap non xml:
<?xml version="1.0" encoding="UTF-8"?>
<urlset xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:schemaLocation="http://www.sitemaps.org/schemas/sitemap/0.9 http://www.sitemaps.org/schemas/sitemap/0.9/sitemap.xsd" xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
<url>
<loc>http://www.test.com/</loc>
<lastmod>2009-08-03T23:40:40+00:00</lastmod>
<changefreq>daily</changefreq>
<priority>1.0</priority>
</url>
<url>
<loc>http://test/</loc>
<lastmod>2009-08-03T23:59:08+00:00</lastmod>
<changefreq>weekly</changefreq>
<priority>0.6</priority>
</url>
</urlset>
Sono abbastanza certo che devi fornire un file sitemap in formato XML (sitemap.xml). Vedi qui per un esempio di formato: http://en.wikipedia.org/wiki/Sitemaps .