Domanda

Possiedo oltre 200 codici video di Google e sto cercando un modo per raccogliere tutti i titoli dei video associati.

So che potrei semplicemente digitare oltre 200 URL in una finestra del browser e copiare e incollare, ma è piuttosto lento e preferirei qualcosa di automatizzato.

Grazie

È stato utile?

Soluzione

Curl e Grep (e Sed)

for code in 6168784043164674382 -6812164614976718979; do
  curl -s http://video.google.com/videoplay?docid=$code | grep "<div class=titlebar-title>" | sed "s/^<div class=titlebar-title>\(.*\)<\/div>$/\1/g"
done

Ovviamente questo potrebbe essere fatto con Perl / Python / PHP / Ruby / qualunque cosa con regex. Google video in realtà ha nomi di classe carini per i loro div.

Autorizzato sotto: CC-BY-SA insieme a attribuzione
Non affiliato a StackOverflow
scroll top