Pregunta

dada la URL de una empresa conocida (p. ej. http://mcdonalds.com/), ¿cómo encontraría de forma automática y fiable el nombre de la empresa (en este caso, "Mc Donalds")?

Gracias

Editar:alguien votó para cerrar esta pregunta, así que tal vez necesito explicar la motivación.Tengo una lista grande de URL de empresas y quiero encontrar datos sobre cada empresa mediante Google Maps.Y buscar en Google Maps con el nombre de la empresa funciona mucho mejor que con la URL.

Eliminar 'http' y 'com' funciona en muchos casos, especialmente para empresas conocidas, pero no en todas.Descubrí que los registros whois no fueron muy útiles.

Esperaba que hubiera algún tipo de base de datos pública que relacionara las empresas con las URL, pero hasta ahora no he encontrado ninguna.

¿Fue útil?

Solución

Usted tendría que crear su propia tabla de búsqueda: Usted tendría que tratar de analizar esta información desde el HTML en la URL para themost datos precisos, por ejemplo: obtener la página de título HTML, o buscar el mensaje Copyright

Otros consejos

muy probable que lo tendrán en el elemento <title/>. Analizar esto y compararlo con el dominio del sitio web. Si hay una coincidencia significativa, es su partido. Si no, pruebe algunas heurísticas en el título (como su nombre lo es todo antes de >> o tal).

Si se trata de una empresa más grande, entonces también podría ser afortunado que mira a la entrada del NIC (también conocido como whois) para su dominio.

puede ser de alguna ayuda, aunque siempre hay casos EDGE que va a tener para manejar con más esfuerzo.

Si quieres ser exacto, yo diría Amazon Mechanical Turk.

Intente utilizar cURL y DOMDocument.

loadHTML($resultado);$título = $dom->getElementsByTagName("título");echo $título->item(0)->nodeValue;?>

Echa un vistazo a la metaetiqueta.

scroll top