Question

Je suis en train de scape revenir un ensemble de liens et le contenu d'un domaine.

La requête dans Google serait

"site:www.newswebsite.com search_term"

J'ai vu des choses près de faire ce travail, mais je ne peux pas sembler obtenir assez une recherche de travail sur un site Web entier, puis filtrer le terme de recherche.

Est-ce possible sans une table de données personnalisée?

Était-ce utile?

La solution

Je suis arrivé au fond de celui-ci à la fin.

select title,abstract,url,date from search.web(0) where query="search_term" and sites="www.website1.com,www.website2.com,www.website3.com" | sort (field='date') | reverse()

Cette recherche 3 sites, les commandes par jour, et le plus récent en premier. Il y a une autre façon d'inverser le genre, mais cela semble fonctionner pour l'instant. Je pense qu'il est descendant = true dans le genre ( 'date' = champ, descendant = 'true')

Très utile, même si je ne dis moi-même.

Autres conseils

Christian Heilmann vient d'écrire un writeup assez agréable sur YQL et obtenir des informations à partir d'un retour HTML source de données sur le site 24ways .

Licencié sous: CC-BY-SA avec attribution
Non affilié à StackOverflow
scroll top