trouver le nom de la société à l'adresse URL
-
19-09-2019 - |
Question
compte tenu de l'URL d'une entreprise bien connue (par exemple http://mcdonalds.com/), comment voulez-vous automatiquement et de manière fiable trouver le nom de la société (dans ce cas "Mc Donalds")?
Merci
Edit:quelqu'un a voté la fermeture de cette question, peut-être que j'ai besoin d'expliquer la motivation.J'ai une grande liste de compagnie Url et je veux trouver des données de chaque entreprise à l'aide de Google Maps.Et de recherche de Google Maps avec le nom de l'entreprise fonctionne bien mieux que l'URL.
Suppression de "http" et " com " fonctionne dans beaucoup de cas, en particulier pour les entreprises bien connues, mais pas tous.J'ai trouvé le whois de dossiers n'ont pas été très utile.
J'espérais qu'il y avait une sorte de base de données publique d'appariement des entreprises pour les Url, mais je n'ai pas rencontré jusqu'à présent.
La solution
Vous devez créer votre propre table de recherche: Vous devrez essayer d'analyser ces informations à partir du html à l'adresse pour themost des données précises, par exemple: obtenir le titre de la page Html ou recherchez le message d'auteur
Autres conseils
Tout à fait probable qu'ils auront dans l'élément <title/>
. Parse cela et le comparer au domaine du site. S'il y a un chevauchement important, il est votre match. Sinon, essayez quelques heuristiques sur le titre (comme le nom est tout ce qui précède >>
ou tel).
Si elle est une grande entreprise, alors vous pourriez aussi avoir la chance regardant l'entrée NIC (alias whois) pour leur domaine.
Si vous voulez être précis, je dirais turk mécanique amazone.
Essayez d'utiliser cURL et DOMDocument.
loadHTML($result);$titre = $dom->getElementsByTagName("titre");echo $title->item(0)->nodeValue;?>Jetez un oeil à la balise meta
Vous pouvez utiliser le whois informations. Il devrait y avoir des bibliothèques pour vous permettre de le faire d'une manière propre. Vous na pas parler de ce type de technologie que vous allez utiliser ...