buscar el nombre de la empresa en la URL
-
19-09-2019 - |
Pregunta
dada la URL de una empresa conocida (p. ej. http://mcdonalds.com/), ¿cómo encontraría de forma automática y fiable el nombre de la empresa (en este caso, "Mc Donalds")?
Gracias
Editar:alguien votó para cerrar esta pregunta, así que tal vez necesito explicar la motivación.Tengo una lista grande de URL de empresas y quiero encontrar datos sobre cada empresa mediante Google Maps.Y buscar en Google Maps con el nombre de la empresa funciona mucho mejor que con la URL.
Eliminar 'http' y 'com' funciona en muchos casos, especialmente para empresas conocidas, pero no en todas.Descubrí que los registros whois no fueron muy útiles.
Esperaba que hubiera algún tipo de base de datos pública que relacionara las empresas con las URL, pero hasta ahora no he encontrado ninguna.
Solución
Usted tendría que crear su propia tabla de búsqueda: Usted tendría que tratar de analizar esta información desde el HTML en la URL para themost datos precisos, por ejemplo: obtener la página de título HTML, o buscar el mensaje Copyright
Otros consejos
muy probable que lo tendrán en el elemento <title/>
. Analizar esto y compararlo con el dominio del sitio web. Si hay una coincidencia significativa, es su partido. Si no, pruebe algunas heurísticas en el título (como su nombre lo es todo antes de >>
o tal).
Si se trata de una empresa más grande, entonces también podría ser afortunado que mira a la entrada del NIC (también conocido como whois) para su dominio.
Si quieres ser exacto, yo diría Amazon Mechanical Turk.
Intente utilizar cURL y DOMDocument.
loadHTML($resultado);$título = $dom->getElementsByTagName("título");echo $título->item(0)->nodeValue;?>Echa un vistazo a la metaetiqueta.
Se puede utilizar el href="http://whois.org/" rel="nofollow noreferrer"> whois información . No debe haber bibliotecas para permitirle hacer eso de una manera limpia. Usted aún menciona qué tipo de tecnología que va a utilizar ...