herramienta en línea para rastrear un sitio web y recuperar toda la información de metadatos para cada página
-
12-09-2019 - |
Pregunta
¿Alguien sabe de una herramienta en línea gratuita que puede rastrear cualquier sitio web determinado y devolver sólo el Meta Descripción y palabras clave de información meta?
Solución
Asumiendo que tiene acceso a Linux / Unix:
mkdir temp
cd temp
wget -r SITE_ADDRESS
A continuación, las palabras clave:
egrep -r -h 'meta[^>]+name="keywords' * | sed 's/^.*content="\([^"]*\)".*$/\1/g'
y para las descripciones:
egrep -r -h 'meta[^>]+name="description' * | sed 's/^.*content="\([^"]*\)".*$/\1/g'
Si desea que todas las palabras clave únicas, trate de:
egrep -r -h 'meta[^>]+name="keywords' * | sed 's/^.*content="\([^"]*\)".*$/\1/g' | sed 's/\s*,\s*/\n/g' | sort | uniq
Estoy seguro de que hay una sola línea o programa por ahí que hace exactamente lo mismo, y hay respuestas definitivamente más fácil.
Otros consejos
Para retrive toda la información meta probar esta herramienta Meta Tags Analizador
Licenciado bajo: CC-BY-SA con atribución
No afiliado a StackOverflow