Реплицируйте предложения изображений Digg из отправленного URL-адреса с помощью PHP

StackOverflow https://stackoverflow.com/questions/959733

Вопрос

Поэтому я ищу идеи, как лучше всего воспроизвести функциональность, представленную на Digg.По сути, вы отправляете URL-адрес интересующей вас страницы, копаете, затем сканируете DOM, чтобы найти все теги IMG (вероятно, выбирая только несколько из них, которые превышают определенную высоту/ширину), а затем создаете из них миниатюру и спрашиваете вас, какие вы хотели бы представить свою заявку.

Хотя там много всего происходит, меня главным образом интересует лучший метод получения изображений с отправленной страницы.

Это было полезно?

Решение

Хотя вы можете попытаться проанализировать веб-страницу, HTML может оказаться настолько беспорядочным, что лучше всего будет использовать что-то близкое, но несовершенное.

  1. Извлеките все, что выглядит как ссылка на тег изображения.
  2. Попробуйте получить URL
  3. Проверьте, вернули ли вы изображение

Просто найдите и запишите содержимое src="..." и вы достигнете цели.Некоторые базовые манипуляции, позволяющие справиться с относительным vs.абсолютные ссылки на изображения, и все готово.

Очевидно, что каждый раз, когда вы получаете веб-ресурс по запросу от третьей стороны, вам необходимо позаботиться о том, чтобы вас не злоупотребили.

Другие советы

Я предлагаю cURL + регулярное выражение.

Вы также можете использовать Простой PHP-парсер HTML DOM который поможет вам выполнить поиск по всем тегам изображений.

Лицензировано под: CC-BY-SA с атрибуция
Не связан с StackOverflow
scroll top