Pregunta

Búsqueda web de Google API ha quedado obsoleto y sustituido por Custom Search API (ver http: // código. google.com/apis/websearch/ ).

Yo quería buscar en toda la web, pero parece que con la nueva API única personalizada sitios pueden ser buscados.

¿Hay una manera de buscar en toda la web mediante programación? Yo era capaz de consultar la antigua API usando JSON desde un programa Java.

¿Fue útil?

Solución

Sólo podría enviarlos a través de un navegador, como lo hace, y luego analizar el código HTML, que es lo que siempre he hecho, incluso para cosas como Youtube.

Otros consejos

Sí, Google Custom Search ahora ha sustituido a la antigua API de búsqueda, pero puede seguir utilizando Google Custom Search para buscar en toda la web , aunque los pasos no son evidentes de la configuración de búsqueda personalizado.

Para crear un motor de búsqueda personalizado que Google búsquedas en toda la Web:

  1. En la página principal de Google Custom Search ( http://www.google.com/cse/ ), haga clic en Crear un motor de búsqueda personalizado.
  2. Escriba un nombre y una descripción para su motor de búsqueda.
  3. En Definir su motor de búsqueda, en los sitios para cuadro de búsqueda, introduzca al menos una URL válida (Por ahora, sólo hay que poner www.anyurl.com para conseguir más allá de esta pantalla. Más sobre esto más adelante).
  4. Seleccione la edición CSE que desee y aceptar las condiciones del servicio, a continuación, haga clic en Siguiente. Seleccione la opción de diseño que desee y, a continuación, haga clic en Siguiente.
  5. Haga clic en cualquiera de los enlaces bajo los siguientes pasos sección de navegar a su panel de control.
  6. En el menú de la izquierda, en Panel de control, haga clic en General.
  7. En la sección de preferencias de búsqueda, seleccione Buscar en toda la Web, pero enfatizar los sitios incluidos.
  8. Haga clic en Guardar cambios.
  9. En el menú de la izquierda, en Panel de control, haga clic en Sitios.
  10. Eliminar el sitio que ha introducido durante el proceso de configuración inicial.

Ahora su motor de búsqueda personalizado buscará en toda la web.

Precios

  • Google Búsqueda personalizada le da 100 consultas por día de forma gratuita.
  • Después de que usted paga $ 5 por 1000 consultas.
  • Hay un máximo de 10.000 consultas por día.

Fuente: https://developers.google.com/ por encargo de búsqueda / JSON-api / v1 / visión general # precios


  • La búsqueda de calidad es mucho más baja de lo normal de búsqueda de Google (no hay sinónimos, "inteligencia", etc.)
  • Parece que Google está planeando incluso a cerrar este servicio por completo.

Google Búsqueda personalizada (como se propone en las respuestas más altas calificaciones) funciona bien, pero es muy caro, en comparación con sus competidores (abajo) o en comparación con otros Google API. Tiene una pequeña capa gratuita (100 consultas / día) y un muy alto precio de $ 5 por 1000 consulta.

Se ofrece la opción de actualizar a Site Search, que tiene un poco mejores precios, pero eso es para buscar un sitio (el suyo propio), por lo que es realmente algo muy diferente -. No una actualización

Las principales alternativas parecen ser:

Bing API de búsqueda
https://datamarket.azure.com/dataset/5BA839F1-12CE-4CCE -BF57-A49D98D29A44
Que tiene una capa gratuita de 5000Q / mes, y precios a partir de las 5 de consultas por centavo, y no hay límite duro.

ACTUALIZACIÓN: A finales de 2016 esta API se cerró en favor de su contraparte Azure "cognitivo Servicios Bing API de búsqueda":
https://azure.microsoft.com/en-us/services/ cognitivos-services / search /

Vea aquí para una fijación de precios gráfico, que comienza en US $ 3 / m para 1.000 transacciones. A menos que me falta algo que es bastante caro.

el jefe de Yahoo API de búsqueda
ACTUALIZACIÓN: se suspendió el 31 de marzo 2016. http://developer.yahoo.com/boss/search/
Con precios que comienzan en alrededor de 12 consultas / centavo por búsquedas en la web enteras.

Y algunos que no he oído hablar de antes:

http://www.gigablast.com/searchfeed.html

http://www.faroo.com/hp/api/api.html

http://www.commoncrawl.org/

http://www.entireweb.com/search_api/implementation/
[Descontinuado - como fuera puntiagudo abajo]

Hay un poco de discusión de algunos de estos en este post SO .
[Consiguió cerrado por ser fuera de tema y ahora se ha ido]

Esta es una opción en la parte inferior del panel de control de búsqueda personalizado: "sitios para buscar" , puede elegir "Buscar en toda la Web, pero enfatizar los sitios incluidos"

Custom Search Panel de control - Sitios para buscar

Yo sólo he encontrado esto desde Común del arrastre.

http://www.commoncrawl.org/

Puede que sea la respuesta que todos estamos buscando !!

No es una nota en la parte superior de la docs :

  

Nota: La API de búsqueda web de Google tiene   sido oficialmente obsoleta   1 de noviembre de 2010. Se continuará   funcionando de acuerdo desaprobación política ,   pero el número de solicitudes que usted pueda   maquillaje por día será limitado.   Por lo tanto, le recomendamos que pasar a   la nueva Custom Search API .

El desaprobación política dice que van a seguir para ejecutar el API para 3 años. Así que si usted ya tiene una aplicación que utiliza la API de edad, usted no tiene que apresurarse a cambiar las cosas por el momento. Si va a escribir una nueva aplicación, utilice el Custom Search API . Véase mi respuesta aquí de cómo hacer esto en Python, pero la idea es la mismo para cualquier idioma.

Hay una API de Java llamada gratuita JFreeWebSearch que utiliza el ya mencionado Faroo: http://www.ke.tu-darmstadt.de/resources/jfreewebsearch

Puede crear "en todas partes" búsqueda personalizada motor derecho de la página principal de Google Custom Search ( http: // www. google.com/cse/ ). Usted debe hacer clic 'avanzada', durante la adición de nuevos motores. Allí se puede proporcionar Schema.org tipo de sitio. ' cosa ' es el tipo más genérico, que cubre toda la web.

Gigablast ofrece un Web barato búsqueda API: http://www.gigablast.com/searchfeed.html

Licenciado bajo: CC-BY-SA con atribución
No afiliado a StackOverflow
scroll top