質問

Google Web検索APIは非推奨になり、カスタム検索APIに置き換えられました(参照 http://code.google.com/apis/websearch/).

Web全体を検索したかったのですが、新しいAPIのみでカスタムサイトを検索できるように見えます。

Web全体をプログラムで検索する方法はありますか? JavaプログラムのJSONを使用して古いAPIを照会することができました。

役に立ちましたか?

解決

ブラウザのようにそれらを送信するだけで、YouTubeのようなものであっても、HTMLを解析することができます。

他のヒント

はい、Googleカスタム検索が古い検索APIに置き換えられましたが、 できる それでもGoogleカスタム検索を使用してWeb全体を検索します, 、カスタム検索セットアップからは手順は明らかではありません。

Web全体を検索するGoogleカスタム検索エンジンを作成するには:

  1. Googleカスタム検索ホームページから( http://www.google.com/cse/ )、カスタム検索エンジンの作成をクリックします。
  2. 検索エンジンの名前と説明を入力します。
  3. 検索エンジンを定義する下で、[サイト]を検索するサイトで、少なくとも1つの有効なURLを入力します(今のところ、www.anyurl.comを置いてこの画面を通過します。詳細については後で詳しく説明します)。
  4. 必要なCSEエディションを選択し、サービスの利用規約を受け入れ、[次へ]をクリックします。必要なレイアウトオプションを選択し、[次へ]をクリックします。
  5. 次の手順]セクションの任意のリンクをクリックして、コントロールパネルに移動します。
  6. 左側のメニューで、コントロールパネルの下で、[基本]をクリックします。
  7. 検索設定]セクションで、Web全体を検索しますが、含まれるサイトを強調します。
  8. 変更を保存]をクリックします。
  9. 左側のメニューで、コントロールパネルの下で、[サイト]をクリックします。
  10. 最初のセットアッププロセス中に入力したサイトを削除します。

これで、カスタム検索エンジンがWeb全体を検索します。

価格設定

  • Google Custom Searchでは、1日に100のクエリを無料で提供します。
  • その後、1000クエリごとに5ドルを支払います。
  • 1日あたり最大10,000クエリがあります。

ソース: https://developers.google.com/custom-search/json-api/v1/overview#pricing


  • 検索品質は、通常のGoogle検索よりもはるかに低い(同義語なし、「インテリジェンス」など)
  • Googleはこのサービスを完全に閉鎖することさえ計画しているようです。

Google Custom Search(最高評価の回答で提唱されている)はうまく機能しますが、競合他社(以下)と比較して、または他のGoogle APIと比較して非常に高価です。小さな無料層(100クエリ/日)と、1000クエリあたり5ドルの価格が非常に高いです。

彼らはサイト検索にアップグレードするオプションを提供しますが、これにはわずかに優れた価格がありますが、それは1つのサイト(あなた自身の)を検索するためのものであるため、本当にまったく違うものです - アップグレードではありません。

主な選択肢は次のとおりです。

Bing検索API
https://datamarket.azure.com/dataset/5ba839f1-12ce-4cce-bf57-a49d98d29a44
5000Q/月の無料ティアがあり、価格は1ペニーあたり5クエリから始まり、厳しい制限はありません。

更新:2016年末に、このAPIはAzureのカウンターパート「認知サービスBing Search API」を支持してシャットダウンしました。
https://azure.microsoft.com/en-us/services/cognitive-services/search/

こちらをご覧ください 1,000トランザクションで3ドル/mから始まる価格設定チャートの場合。私が何かが足りないのでなければ、それは非常に高価です。

Yahoo Boss Search API
更新:2016年3月31日に中止されました。http://developer.yahoo.com/boss/search/
Web全体の検索の場合、価格は約12クエリ/ペニーから始まります。

そして、私が前に聞いたことがないいくつか:

http://www.gigablast.com/searchfeed.html

http://www.faroo.com/hp/api/api.html

http://www.commoncrawl.org/

http://www.entireweb.com/search_api/implementation/
中止 - 以下で指摘したように

これらのいくつかについて少し議論しています これは投稿です.
トピック外であるために閉鎖され、今はなくなりました

カスタム検索コントロールパネルの下部にあるオプションは次のとおりです。 「検索するサイト」, 、 選んでいいですよ 「ウェブ全体を検索しますが、含まれるサイトを強調します」

Custom Search Control Panel - Sites to search

Farooには 無料のWeb検索API

私はちょうど一般的なクロールからこれに出くわしました。

http://www.commoncrawl.org/

私たち全員が探している答えかもしれません!!

上にメモがあります ドキュメント:

注:Google Web検索APIは、2010年11月1日の時点で正式に非推奨されています。 非推奨ポリシー、しかし、1日あたりのリクエストの数は制限されます。したがって、私たちはあなたが新しいものに移動することをお勧めします カスタム検索API.

非推奨ポリシー 彼らは3年間APIを実行し続けると言います。したがって、古いAPIを使用しているアプリケーションが既にある場合、まだ物事を変更するために急いでいる必要はありません。新しいアプリケーションを書いている場合は、を使用してください カスタム検索API. 。私の答えを見てください ここ Pythonでこれを行う方法については、アイデアはどんな言語でも同じです。

Jfreewebsearchと呼ばれる無料のJava APIがあります。http://www.ke.tu-darmstadt.de/resources/jfreewebsearch

Googleカスタム検索ホームページから「Everywhere」カスタム検索エンジンを作成できます( http://www.google.com/cse/ )。新しいエンジンを追加する際に、「Advanced」をクリックするだけです。そこで、schema.orgサイトタイプを提供できます。 'もの「すべてのWebをカバーする最も一般的なタイプです。

Gigablastは安価なWeb検索APIを提供します: http://www.gigablast.com/searchfeed.html

ライセンス: CC-BY-SA帰属
所属していません StackOverflow
scroll top