yql كشط موقع الويب/المجال بأكمله
-
20-09-2019 - |
سؤال
أحاول أن أعود إلى مجموعة من الروابط والمحتوى من مجال.
سيكون الاستعلام في Google
"site:www.newswebsite.com search_term"
لقد رأيت بعض الأشياء الوثيقة للحصول على هذا العمل ، لكن لا يمكنني الحصول على بحث يعمل عبر موقع ويب بأكمله ، ثم تصفية بمصطلح البحث.
هل هذا ممكن بدون جدول بيانات مخصص؟
المحلول
وصلت إلى أسفله في النهاية.
select title,abstract,url,date from search.web(0) where query="search_term" and sites="www.website1.com,www.website2.com,www.website3.com" | sort (field='date') | reverse()
هذا يبحث عن 3 مواقع ، أوامر حسب التاريخ ، وأحدث أولاً. هناك طريقة بديلة لعكس هذا النوع ، ولكن يبدو أن هذا يعمل في الوقت الحالي. أعتقد أنه ينحدر = صحيح داخل النوع (الحقل = "التاريخ" ، defcending = 'true')
مفيد جدا ، حتى لو قلت ذلك بنفسي.
نصائح أخرى
كتب كريستيان هيلمان للتو كتابة لطيفة إلى حد ما على YQL واستعادة المعلومات من مصدر بيانات HTML على موقع 24way.
لا تنتمي إلى StackOverflow