Question

compte tenu de l'URL d'une entreprise bien connue (par exemple http://mcdonalds.com/), comment voulez-vous automatiquement et de manière fiable trouver le nom de la société (dans ce cas "Mc Donalds")?

Merci

Edit:quelqu'un a voté la fermeture de cette question, peut-être que j'ai besoin d'expliquer la motivation.J'ai une grande liste de compagnie Url et je veux trouver des données de chaque entreprise à l'aide de Google Maps.Et de recherche de Google Maps avec le nom de l'entreprise fonctionne bien mieux que l'URL.

Suppression de "http" et " com " fonctionne dans beaucoup de cas, en particulier pour les entreprises bien connues, mais pas tous.J'ai trouvé le whois de dossiers n'ont pas été très utile.

J'espérais qu'il y avait une sorte de base de données publique d'appariement des entreprises pour les Url, mais je n'ai pas rencontré jusqu'à présent.

Était-ce utile?

La solution

Vous devez créer votre propre table de recherche: Vous devrez essayer d'analyser ces informations à partir du html à l'adresse pour themost des données précises, par exemple: obtenir le titre de la page Html ou recherchez le message d'auteur

Autres conseils

Tout à fait probable qu'ils auront dans l'élément <title/>. Parse cela et le comparer au domaine du site. S'il y a un chevauchement important, il est votre match. Sinon, essayez quelques heuristiques sur le titre (comme le nom est tout ce qui précède >> ou tel).

Si elle est une grande entreprise, alors vous pourriez aussi avoir la chance regardant l'entrée NIC (alias whois) pour leur domaine.

WHOIS peut être d'une certaine aide, mais il y a toujours des cas bord que vous aurez à gérer avec plus effort.

Si vous voulez être précis, je dirais turk mécanique amazone.

Essayez d'utiliser cURL et DOMDocument.

loadHTML($result);$titre = $dom->getElementsByTagName("titre");echo $title->item(0)->nodeValue;?>

Jetez un oeil à la balise meta

Vous pouvez utiliser le whois informations. Il devrait y avoir des bibliothèques pour vous permettre de le faire d'une manière propre. Vous na pas parler de ce type de technologie que vous allez utiliser ...

Licencié sous: CC-BY-SA avec attribution
Non affilié à StackOverflow
scroll top