“Wget --domains” não ajudar .. o que estou fazendo de errado? [fechadas]
-
21-08-2019 - |
Pergunta
Eu estou tentando usar o wget para agarrar de forma recursiva apenas os arquivos .jpg de um site particular, com vista à criação de um screensaver divertido para mim. Não é um objetivo tão elevado de verdade.
O problema é que as imagens são hospedados em outro lugar (mfrost.typepad.com), e não sobre o principal domínio do site (www.cuteoverload.com).
Eu tentei usar "D" para especificados os domínios permitidos, mas infelizmente jpgs nenhuma bonitos foram próximas. Como eu poderia alterar a linha abaixo para fazer este trabalho?
wget -r -l2 -np -w1 -D www.cuteoverload.com,mfrost.typepad.com -A.jpg -R.html.php.gif www.cuteoverload.com/
Graças.
Solução
Um exame de wget 's página homem [1] diz isso sobre -D:
Definir domínios a ser seguido. domínio de lista é uma lista separada por vírgulas de domínios. Note que ele não liga -H.
Este aviso sobre -H parece interessante:
Ativar mede através de anfitriões ao fazer recuperação recursiva.
Então, você precisa apenas de adicionar a bandeira -H à sua invocação.
(Tendo feito isso, parece que todas as imagens são restritos a mfrost.typepad.com/cute_overload/images/2008/12/07 e mfrost.typepad.com/cute_overload/ imagens / 2008 / 08/12 ).
- [1] Apesar de wget 's manual de referência principal é em formato de informações.