herramienta en línea para rastrear un sitio web y recuperar toda la información de metadatos para cada página

StackOverflow https://stackoverflow.com/questions/771919

  •  12-09-2019
  •  | 
  •  

Pregunta

¿Alguien sabe de una herramienta en línea gratuita que puede rastrear cualquier sitio web determinado y devolver sólo el Meta Descripción y palabras clave de información meta?

¿Fue útil?

Solución

Asumiendo que tiene acceso a Linux / Unix:

mkdir temp
cd temp
wget -r SITE_ADDRESS

A continuación, las palabras clave:

egrep -r -h 'meta[^>]+name="keywords' * | sed 's/^.*content="\([^"]*\)".*$/\1/g'

y para las descripciones:

egrep -r -h 'meta[^>]+name="description' * | sed 's/^.*content="\([^"]*\)".*$/\1/g'

Si desea que todas las palabras clave únicas, trate de:

egrep -r -h 'meta[^>]+name="keywords' * | sed 's/^.*content="\([^"]*\)".*$/\1/g' | sed 's/\s*,\s*/\n/g' | sort | uniq

Estoy seguro de que hay una sola línea o programa por ahí que hace exactamente lo mismo, y hay respuestas definitivamente más fácil.

Otros consejos

Para retrive toda la información meta probar esta herramienta Meta Tags Analizador

Licenciado bajo: CC-BY-SA con atribución
No afiliado a StackOverflow
scroll top