Получение Sitemap - это HTML из Google Webmaster Tool
-
11-07-2019 - |
Вопрос
[Записка для мудрых:перейти к последнему Редактировать]
У меня есть очень простая карта сайта в формате txt (с именем sitemap.txt), которая выглядит следующим образом:
http://myDomain.com
http://myDomain.com/about.html
http://myDomain.com/faq.html
http://myDomain.com/careers.html
Когда я загружаю его в инструменты для веб-мастеров, я получаю:
Карта сайта - это HTML - Ваша карта сайта выглядит как HTML-страница.Пожалуйста, используйте вместо этого поддерживаемый формат sitemap
Я попробовал несколько альтернатив (например, с www или без него), но безуспешно.
У кого-нибудь есть какие-нибудь подсказки?
Любая помощь приветствуется!
Редактировать:
Я попробовал использовать xml sitemap и получил ту же ошибку, поэтому похоже, что сервер обслуживает все как HTML (как правильно предполагает ceejayoz).Теперь вопрос в следующем ... как мне передать текст с сервера appspot на сервер в виде обычного текста?
Редактировать:
Хорошо - мне это надоело, и я внедрил сервлет для обслуживания моих sitemap (сейчас я пытаюсь использовать как XML, так и TXT) явно в виде text / plain.Все работает нормально, если я вручную вызываю сервлет, но по-прежнему получаю карту сайта в формате HTML.Я не знаю, куда стукнуться головой!
Редактировать: Я попытался проверить content-type с помощью плагина firefox - кажется, все идет так, как ожидалось (я указываю фактический URL, чтобы люди могли посмотреть):
http://wokheisandbox.appspot.com/sitemaps/sitemap.txt --> Тип содержимого:текстовый /обычный http://wokheisandbox.appspot.com/sitemaps/sitemap.xml --> Тип содержимого:приложение /xml
С моим сервлетом (явная настройка text/plain):http://wokheisandbox.appspot.com/wokhei/serveSitemap?fileType=TXT --> Тип содержимого:текстовый /обычный http://wokheisandbox.appspot.com/wokhei/serveSitemap?fileType=XML --> Тип содержимого:текстовый /обычный
Все, что я получаю от инструмента для веб-мастеров, это ...>Карта сайта - это HTML.
Редактировать:
Я думаю, я нашел причину -> Я зарегистрировал свой сайт в Google Webmaster Tools как http://mydomain.com но приложение размещено на appspot по адресу http://myapp.appspot.com который сопоставлен с mydomain.com.Если я зарегистрируюсь http://myapp.appspot.com все работает нормально (карта сайта проверена).
Это хорошая новость, но это не идеально, потому что я хочу mydomain.com для индексации ...есть какие-нибудь идеи о том, как их преодолеть?
Решение
Похоже, ваш веб-сервер обслуживает .txt
файлы как text/html
вместо того , чтобы text/plain
.
Для Apache это должно быть исправлено следующим образом в файле .htaccess:
AddType text/plain .txt
Другие советы
Я нашел это тема, обсуждающая повторяющиеся записи, вызвавшие недавнее огорчение на карте сайта.Я не вижу этой проблемы в вашей карте сайта, но вы не хотите никаких дубликатов между записями.Например, убедитесь, что ваша карта сайта не содержит ОБОИХ следующих элементов:
http://mydomain.com/ or http://www.mydomain.com/
AND
http://mydomain.com/index.html or http://www.mydomain.com/index.html
Я думаю, вы опубликовали всю свою карту сайта целиком, так что, опять же, я не думаю, что это именно ваша проблема.Вы упомянули, что пробовали различные URL-адреса (с www и без него). Если вы проверяете карту сайта с помощью инструментов Google для веб-мастеров, может потребоваться до 20 минут, чтобы исправление вступило в силу.Я надеюсь, что это поможет.
<?xml version='1.0' encoding='utf-8' ?>
<urlset xmlns='http://www.sitemaps.org/schemas/sitemap/0.9'>
<url>
<loc>http://myDomain.com</loc>
</url>
<url>
<loc>http://myDomain.com/about.html</loc>
</url>
<url>
<loc>http://myDomain.com/faq.html</loc>
</url>
<url>
<loc>http://myDomain.com/careers.html</loc>
</url>
</urlset>
У меня этот способ всегда срабатывает.
На всякий случай, если вы измените свое мнение о картах сайта, отличных от xml:
<?xml version="1.0" encoding="UTF-8"?>
<urlset xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:schemaLocation="http://www.sitemaps.org/schemas/sitemap/0.9 http://www.sitemaps.org/schemas/sitemap/0.9/sitemap.xsd" xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
<url>
<loc>http://www.test.com/</loc>
<lastmod>2009-08-03T23:40:40+00:00</lastmod>
<changefreq>daily</changefreq>
<priority>1.0</priority>
</url>
<url>
<loc>http://test/</loc>
<lastmod>2009-08-03T23:59:08+00:00</lastmod>
<changefreq>weekly</changefreq>
<priority>0.6</priority>
</url>
</urlset>
Я совершенно уверен, что вам нужно предоставить файл sitemap в формате XML (sitemap.xml).Смотрите здесь пример формата: http://en.wikipedia.org/wiki/Sitemaps.