Вопрос

[Записка для мудрых:перейти к последнему Редактировать]

У меня есть очень простая карта сайта в формате txt (с именем sitemap.txt), которая выглядит следующим образом:

http://myDomain.com
http://myDomain.com/about.html
http://myDomain.com/faq.html
http://myDomain.com/careers.html

Когда я загружаю его в инструменты для веб-мастеров, я получаю:

Карта сайта - это HTML - Ваша карта сайта выглядит как HTML-страница.Пожалуйста, используйте вместо этого поддерживаемый формат sitemap

Я попробовал несколько альтернатив (например, с www или без него), но безуспешно.

У кого-нибудь есть какие-нибудь подсказки?

Любая помощь приветствуется!

Редактировать:

Я попробовал использовать xml sitemap и получил ту же ошибку, поэтому похоже, что сервер обслуживает все как HTML (как правильно предполагает ceejayoz).Теперь вопрос в следующем ... как мне передать текст с сервера appspot на сервер в виде обычного текста?

Редактировать:

Хорошо - мне это надоело, и я внедрил сервлет для обслуживания моих sitemap (сейчас я пытаюсь использовать как XML, так и TXT) явно в виде text / plain.Все работает нормально, если я вручную вызываю сервлет, но по-прежнему получаю карту сайта в формате HTML.Я не знаю, куда стукнуться головой!

Редактировать: Я попытался проверить content-type с помощью плагина firefox - кажется, все идет так, как ожидалось (я указываю фактический URL, чтобы люди могли посмотреть):

http://wokheisandbox.appspot.com/sitemaps/sitemap.txt --> Тип содержимого:текстовый /обычный http://wokheisandbox.appspot.com/sitemaps/sitemap.xml --> Тип содержимого:приложение /xml

С моим сервлетом (явная настройка text/plain):http://wokheisandbox.appspot.com/wokhei/serveSitemap?fileType=TXT --> Тип содержимого:текстовый /обычный http://wokheisandbox.appspot.com/wokhei/serveSitemap?fileType=XML --> Тип содержимого:текстовый /обычный

Все, что я получаю от инструмента для веб-мастеров, это ...>Карта сайта - это HTML.

Редактировать:

Я думаю, я нашел причину -> Я зарегистрировал свой сайт в Google Webmaster Tools как http://mydomain.com но приложение размещено на appspot по адресу http://myapp.appspot.com который сопоставлен с mydomain.com.Если я зарегистрируюсь http://myapp.appspot.com все работает нормально (карта сайта проверена).

Это хорошая новость, но это не идеально, потому что я хочу mydomain.com для индексации ...есть какие-нибудь идеи о том, как их преодолеть?

Это было полезно?

Решение

Похоже, ваш веб-сервер обслуживает .txt файлы как text/html вместо того , чтобы text/plain.

Для Apache это должно быть исправлено следующим образом в файле .htaccess:

AddType text/plain .txt

Другие советы

Я нашел это тема, обсуждающая повторяющиеся записи, вызвавшие недавнее огорчение на карте сайта.Я не вижу этой проблемы в вашей карте сайта, но вы не хотите никаких дубликатов между записями.Например, убедитесь, что ваша карта сайта не содержит ОБОИХ следующих элементов:

http://mydomain.com/ or http://www.mydomain.com/

AND

http://mydomain.com/index.html or http://www.mydomain.com/index.html

Я думаю, вы опубликовали всю свою карту сайта целиком, так что, опять же, я не думаю, что это именно ваша проблема.Вы упомянули, что пробовали различные URL-адреса (с www и без него). Если вы проверяете карту сайта с помощью инструментов Google для веб-мастеров, может потребоваться до 20 минут, чтобы исправление вступило в силу.Я надеюсь, что это поможет.

<?xml version='1.0' encoding='utf-8' ?>
<urlset xmlns='http://www.sitemaps.org/schemas/sitemap/0.9'>
    <url>
        <loc>http://myDomain.com</loc>
    </url>
    <url>
        <loc>http://myDomain.com/about.html</loc>
    </url>
    <url>
        <loc>http://myDomain.com/faq.html</loc>
    </url>
    <url>
        <loc>http://myDomain.com/careers.html</loc>
    </url>
</urlset>

У меня этот способ всегда срабатывает.

На всякий случай, если вы измените свое мнение о картах сайта, отличных от xml:

<?xml version="1.0" encoding="UTF-8"?>
<urlset xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:schemaLocation="http://www.sitemaps.org/schemas/sitemap/0.9 http://www.sitemaps.org/schemas/sitemap/0.9/sitemap.xsd" xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
  <url>
    <loc>http://www.test.com/</loc>
    <lastmod>2009-08-03T23:40:40+00:00</lastmod>
    <changefreq>daily</changefreq>
    <priority>1.0</priority>
  </url>
  <url>
    <loc>http://test/</loc>
    <lastmod>2009-08-03T23:59:08+00:00</lastmod>
    <changefreq>weekly</changefreq>
    <priority>0.6</priority>
  </url>
</urlset>

Я совершенно уверен, что вам нужно предоставить файл sitemap в формате XML (sitemap.xml).Смотрите здесь пример формата: http://en.wikipedia.org/wiki/Sitemaps.

Лицензировано под: CC-BY-SA с атрибуция
Не связан с StackOverflow
scroll top