質問

Googleはいつサイトを再クロールしますか? また、Googleがキャッシュに同じページの2つのバージョンを持っているのはなぜですか?

http://forum.portal.edu.ro/index.php ?showtopic = 112733 キャッシュページは次のとおりです:forum.portal.edu.ro/index.php?showtopic=112733&st=25/ forum.portal.edu.ro/index.php?showtopic=112733 <!> amp; st = 50

役に立ちましたか?

解決

Googleのクロールポリシーに関する多くの議論があります。最善の方法は、ログを確認して、サイトのスケジュールを確認することです。

キャッシュ内の複数のエントリに関しては、Googleはそれらが同じページではないことを知る方法がありません。それらは異なるURLとおそらく異なるデータを持っています。特定のページを使用する場合は、<link rel="canonical" href="(standard URL)">を使用してみてください。

他のヒント

ページが再クロールされる頻度は、ランキングの高さと、サイトマップで提案した更新間隔によって異なります。ページのコンテンツや、リンクしているサイトの種類など、他のいくつかの要因も考慮される場合があります。

キャッシュ内の2つのページはまったく同じページではありません。1つはスレッドの2ページで、もう1つは3ページです。 URLとコンテンツが異なるため、それらは別々のページです。

検索エンジンでページを本当に同じものとしてカウントしたい場合は、linkタグとrel="canonical"を使用してスレッドの最初のページを指すことができます。

@Chris:サイト構成<!> gt;設定<!> gt;カスタムクロールレートを設定します。この設定は、サイトをクロールできる速度で決定するだけで、クロールの頻度は設定しません。サイトのクロールを増やすには、サイトのリンクを他のサイトにも投稿してみてください。

調整することで、クロールの速度を上げることができます:

サイト構成<!> gt;設定<!> gt;カスタムクロールレートの設定

ウェブサイトのコンテンツの種類に依存し、PageRankにも依存します。めったに更新されない情報を提供する静的なページは1か月に1回程度訪問する可能性があり、1日に多くの投稿がある人気のブログは1日に数回クロールされる可能性があります。 (ただし、ブログの場合、通常、ブログソフトウェアは検索エンジンにpingを送信するため、オンデマンドでクロールされます)

これらは中程度のトラフィックのサイトでのフォーラム投稿であるように見えるため、週に数回クロールされるはずです。現在、Alexaで8,000,000未満のランキングを持っている自分のWebサイトでさえ、ほぼ毎日robots.txtのリクエストで毎週クロールされます。

同様のコンテンツを持つページは自動的にグループ化されますが、グループ化されていない場合は、rel = <!> quot; canonical <!> quot;を試してください。他の回答者からのヒント。

@Chris:いいえ、その設定はサイトがクロールされる頻度を変更せず、クロール中にGoogleがページをリクエストする速度のみを変更します。これは誤解を招く設定であり、多くの人がその間違いを犯しますが、ヘルプページに明確に示されています。

ライセンス: CC-BY-SA帰属
所属していません StackOverflow
scroll top