Pergunta

Então, eu estou à procura de ideias sobre a melhor forma de replicar a funcionalidade visto em digg. Essencialmente, você envia uma URL de sua página de interesse, digg então crawl é o DOM para encontrar todas as tags IMG (provavelmente só selecionar alguns que são acima de uma altura determinada / largura) e, em seguida, cria uma miniatura deles e pede-lhe que você gostaria de representar a sua submissão.

Enquanto não há muita coisa acontecendo lá, eu estou interessado principalmente no melhor método para recuperar as imagens da página apresentada.

Foi útil?

Solução

Enquanto você poderia tentar analisar o HTML página web pode ser uma bagunça tão grande que você seria melhor com algo próximo mas imperfeito.

  1. Extrair tudo o que se parece com uma referência tag de imagem.
  2. Tente buscar o URL
  3. Verifique se você tem uma imagem de volta

Apenas procurando e capturar o conteúdo do src = "..." você chegar lá. Alguns manipulação básica para lidar com relativo vs. referências de imagem absoluta e você está lá.

Obviamente quando você buscar um ativo web sob demanda de um terceiro que você precisa tomar cuidado para que você não está sendo abusada.

Outras dicas

Eu sugiro cURL + regexp.

Você também pode usar PHP simples HTML DOM Parser que irá ajudá-lo a procurar todas as tags de imagem.

Licenciado em: CC-BY-SA com atribuição
Não afiliado a StackOverflow
scroll top