Domanda

[ Nota per il saggio : passa all'ultimo MODIFICA ]

Ho una sitemap txt molto semplice (chiamata sitemap.txt) che assomiglia a questa:

http://myDomain.com
http://myDomain.com/about.html
http://myDomain.com/faq.html
http://myDomain.com/careers.html

Quando lo carico su strumenti per i webmaster ottengo:

Sitemap è HTML - La tua Sitemap sembra essere una pagina HTML. Utilizza invece un formato di sitemap supportato

Ho provato alcune alternative (come con o senza www) ma senza fortuna.

Qualcuno ha qualche idea?

Qualsiasi aiuto apprezzato!

Modifica :

Ho provato con una sitemap xml e ho ottenuto lo stesso errore, quindi sembra che il server stia servendo tutto come HTML (come suggerisce correttamente ceejayoz). Ora la domanda è ... come posso ottenere il server appspot sul server come semplice testo ?

Modifica

Ok - Mi sono stufato e ho implementato un servlet per servire le mie sitemap (ora sto provando sia con XML che con TXT) esplicitamente come text / plain. Tutto funziona bene se invoco manualmente il servlet ma ottenere comunque Sitemap è HTML. Non so dove sbattere la testa!

Modifica Ho provato a verificare il tipo di contenuto con un plug-in firefox - tutto sembra venire fuori come previsto (sto inserendo l'URL effettivo in modo che le persone possano dare un'occhiata):

http://wokheisandbox.appspot.com/sitemaps/sitemap.txt - > Tipo di contenuto: testo / semplice http://wokheisandbox.appspot.com/sitemaps/sitemap.xml - > ; Tipo di contenuto: application / xml

Con il mio servlet (impostazione esplicita del testo / plain): http://wokheisandbox.appspot.com/wokhei/serveSitemap?fileType=TXT - > Tipo di contenuto: testo / semplice http://wokheisandbox.appspot.com/wokhei/serveSitemap?fileType=XML - > Tipo di contenuto: testo / semplice

Tutto ciò che ottengo dallo strumento per i webmaster è ancora - > Sitemap è HTML .

Modifica :

Penso di aver scoperto il motivo - > Mi sono registrato su google webmaster tools il mio sito come http://mydomain.com ma l'app è ospitata su appspot in http://myapp.appspot.com che è mappato su mydomain.com. Se registro http://myapp.appspot.com tutto funziona bene (sitemap convalidato).

Questa è una buona notizia, ma non è l'ideale perché voglio che mydomain.com sia indicizzato ... hai idea di come superare?

È stato utile?

Soluzione

Sembra che il tuo server web stia servendo i file .txt come text / html anziché text / plain .

Per Apache, il seguente in un file .htaccess dovrebbe risolverlo:

AddType text/plain .txt

Altri suggerimenti

Ho trovato questo discutendo voci duplicate che hanno causato recenti dolore mappa del sito . Non vedo questo problema nella tua Sitemap ma non vuoi duplicati tra le voci. Ad esempio, assicurati che la tua Sitemap non contenga ENTRAMBI quanto segue:

http://mydomain.com/ or http://www.mydomain.com/

AND

http://mydomain.com/index.html or http://www.mydomain.com/index.html

Penso che tu abbia pubblicato l'intera Sitemap, quindi, di nuovo, non penso che questo sia esattamente il tuo problema. Hai menzionato di aver provato vari URL (con e senza www.) Se stai convalidando la Sitemap tramite gli Strumenti di Google WebMaster potrebbero essere necessari fino a 20 minuti affinché la correzione abbia effetto. Spero che sia d'aiuto.

<?xml version='1.0' encoding='utf-8' ?>
<urlset xmlns='http://www.sitemaps.org/schemas/sitemap/0.9'>
    <url>
        <loc>http://myDomain.com</loc>
    </url>
    <url>
        <loc>http://myDomain.com/about.html</loc>
    </url>
    <url>
        <loc>http://myDomain.com/faq.html</loc>
    </url>
    <url>
        <loc>http://myDomain.com/careers.html</loc>
    </url>
</urlset>

In questo modo funziona sempre per me.

Nel caso in cui cambiassi idea sulle sitemap non xml:

<?xml version="1.0" encoding="UTF-8"?>
<urlset xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:schemaLocation="http://www.sitemaps.org/schemas/sitemap/0.9 http://www.sitemaps.org/schemas/sitemap/0.9/sitemap.xsd" xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
  <url>
    <loc>http://www.test.com/</loc>
    <lastmod>2009-08-03T23:40:40+00:00</lastmod>
    <changefreq>daily</changefreq>
    <priority>1.0</priority>
  </url>
  <url>
    <loc>http://test/</loc>
    <lastmod>2009-08-03T23:59:08+00:00</lastmod>
    <changefreq>weekly</changefreq>
    <priority>0.6</priority>
  </url>
</urlset>

Sono abbastanza certo che devi fornire un file sitemap in formato XML (sitemap.xml). Vedi qui per un esempio di formato: http://en.wikipedia.org/wiki/Sitemaps .

Autorizzato sotto: CC-BY-SA insieme a attribuzione
Non affiliato a StackOverflow
scroll top