YQL очищает весь веб-сайт / домен
-
20-09-2019 - |
Вопрос
Я пытаюсь восстановить набор ссылок и контента из домена.
Запрос в Google будет следующим
"site:www.newswebsite.com search_term"
Я видел кое-что близкое к тому, чтобы это заработало, но, похоже, я не могу заставить поиск работать по всему веб-сайту, а затем фильтровать по поисковому запросу.
Возможно ли это без пользовательской таблицы данных?
Решение
В конце концов я докопался до сути.
select title,abstract,url,date from search.web(0) where query="search_term" and sites="www.website1.com,www.website2.com,www.website3.com" | sort (field='date') | reverse()
Выполняется поиск по 3 сайтам, заказам по дате и сначала по самым новым.Существует альтернативный способ отменить сортировку, но, похоже, на данный момент это работает.Я думаю, что это по убыванию= true внутри сортировки (поле = 'дата', по убыванию='true')
Очень полезно, даже если я сам так говорю.
Другие советы
Кристиан Хайльманн только что написал довольно хорошую статью о YQL и получении информации из HTML-источника данных на веб-сайт 24ways.