Obtener Sitemap es HTML de Google Webmaster Tool
-
11-07-2019 - |
Pregunta
[ Nota para el sabio : salta al último EDITAR ]
Tengo un mapa de sitio txt muy simple (llamado sitemap.txt) que se ve así:
http://myDomain.com
http://myDomain.com/about.html
http://myDomain.com/faq.html
http://myDomain.com/careers.html
Cuando lo cargo en las herramientas para webmasters obtengo:
El mapa del sitio es HTML - Su mapa del sitio parece ser una página HTML. Utilice un formato de mapa del sitio compatible en su lugar
Intenté algunas alternativas (como con o sin www) pero no tuve suerte.
¿Alguien alguna pista?
¡Se agradece cualquier ayuda!
EDITAR :
Intenté con un mapa del sitio xml y obtuve el mismo error, por lo que parece que el servidor está sirviendo todo como HTML (como sugiere ceejayoz correctamente). Ahora la pregunta es ... ¿Cómo consigo el servidor de Appspot para que el texto del servidor sea texto sin formato ?
EDIT:
Ok: me harté e implementé un servlet para servir mis mapas de sitio (ahora estoy intentando con XML y TXT) explícitamente como texto / sin formato. Todo funciona bien si invoco manualmente el servlet pero sigo obteniendo Sitemap es HTML. ¡No sé dónde golpearme la cabeza!
EDITAR: Traté de verificar el tipo de contenido con un complemento de Firefox; todo parece estar surgiendo como esperado (pongo la URL real para que la gente pueda ver):
http://wokheisandbox.appspot.com/sitemaps/sitemap.txt - > Tipo de contenido: texto / sin formato http://wokheisandbox.appspot.com/sitemaps/sitemap.xml - > ; Tipo de contenido: application / xml
Con mi servlet (configuración de texto / sin formato explícitamente): http://wokheisandbox.appspot.com/wokhei/serveSitemap?fileType=TXT - > Tipo de contenido: texto / sin formato http://wokheisandbox.appspot.com/wokhei/serveSitemap?fileType=XML - > Tipo de contenido: texto / sin formato
Todo lo que obtengo de la herramienta para webmasters sigue siendo - > El mapa del sitio es HTML .
EDITAR :
Creo que descubrí la razón: > Me registré en las herramientas para webmasters de Google en mi sitio como http://mydomain.com pero la aplicación está alojada en la aplicación en http://myapp.appspot.com que está asignado a mydomain.com. Si me registro http://myapp.appspot.com todo funciona bien (mapa del sitio validado).
Estas son buenas noticias, pero no son ideales porque quiero indexar mydomain.com ... ¿alguna idea sobre cómo superarlo?
Solución
Parece que su servidor web está sirviendo archivos .txt
como text / html
en lugar de text / plain
.
Para Apache, lo siguiente en un archivo .htaccess debería solucionarlo:
AddType text/plain .txt
Otros consejos
Encontré este hilo discutiendo entradas duplicadas que causan recientes pena del mapa del sitio . No veo este problema en su mapa del sitio, pero no desea duplicados entre las entradas. Por ejemplo, asegúrese de que su mapa del sitio no contenga AMBOS de los siguientes:
http://mydomain.com/ or http://www.mydomain.com/
AND
http://mydomain.com/index.html or http://www.mydomain.com/index.html
Creo que publicaste todo el mapa del sitio, así que, nuevamente, no creo que este sea tu problema exactamente. Mencionó que ha intentado varias URL (con y sin www.) Si está validando el mapa del sitio a través de las Herramientas de Google WebMaster, puede tomar hasta 20 minutos para que la corrección surta efecto. Espero que ayude.
<?xml version='1.0' encoding='utf-8' ?>
<urlset xmlns='http://www.sitemaps.org/schemas/sitemap/0.9'>
<url>
<loc>http://myDomain.com</loc>
</url>
<url>
<loc>http://myDomain.com/about.html</loc>
</url>
<url>
<loc>http://myDomain.com/faq.html</loc>
</url>
<url>
<loc>http://myDomain.com/careers.html</loc>
</url>
</urlset>
De esta manera siempre funciona para mí.
Por si acaso cambia de opinión acerca de los mapas de sitio que no son xml:
<?xml version="1.0" encoding="UTF-8"?>
<urlset xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:schemaLocation="http://www.sitemaps.org/schemas/sitemap/0.9 http://www.sitemaps.org/schemas/sitemap/0.9/sitemap.xsd" xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
<url>
<loc>http://www.test.com/</loc>
<lastmod>2009-08-03T23:40:40+00:00</lastmod>
<changefreq>daily</changefreq>
<priority>1.0</priority>
</url>
<url>
<loc>http://test/</loc>
<lastmod>2009-08-03T23:59:08+00:00</lastmod>
<changefreq>weekly</changefreq>
<priority>0.6</priority>
</url>
</urlset>
Estoy bastante seguro de que debe proporcionar un archivo de mapa del sitio con formato XML (sitemap.xml). Consulte aquí un ejemplo de formato: http://en.wikipedia.org/wiki/Sitemaps .