質問

良く知られている会社のURL(例えば http://mcdonalds.com/ を)与えられ、どのようにだろうあなたは、自動的にかつ確実に(この場合は「マクドナルド」で)会社名を検索する?

おかげ

編集:誰かがこの質問を閉じるために投票し、ので、多分私は動機を説明する必要があります。私は会社のURLの大規模なリストを持っていると私はGoogleマップを使用して、各企業に関するデータを見つけたいです。そして、会社名でGoogleマップを検索すると、URLよりもはるかに良い働きます。

「のhttp」と「COM」を削除すると、すべてではありませんが、特によく知られている企業のために、多くのケースで作業を行います。私はwhoisのレコードは非常に有用ではなかった見つけます。

私はURLへのパブリック・データベースマッチング企業のいくつかの種類があった期待していたが、今のところ1に遭遇していない。

役に立ちましたか?

解決

あなたはあなた自身のルックアップテーブルを作成する必要があります:あなたが例えば、試してみて、themost正確なデータのためのURLでHTMLからこの情報を解析する必要があります:?HTMLページのタイトルを取得、または著作権メッセージを探して

他のヒント

かなり可能性の高い彼らはそれが<title/>要素になります。これを解析し、Webサイトのドメインと比較します。かなりの重複がある場合、それはあなたの試合です。そうでない場合(名前は>>前か、そのようなすべてのものであるように)、タイトルにいくつかのヒューリスティックを試してみます。

それは大企業の場合は、

は、その後、あなたも自分のドメインに対して(別名Whoisの)NICのエントリを見て幸運である可能性があります。

いつもあなたがより多くの取り扱いにする必要があります例がエッジしているが、

のWhois のデータベースには、いくつかの助けとすることができます努力ます。

あなたが正確になりたい場合は、

、私はアマゾン機械トルコ人だと思います。

のcURLとのDOMDocumentを使用してみてください。

loadHTML($結果);     $タイトル= $、DOM> getElementsByTagNameの( "タイトル");     エコー$ title->アイテム(0) - >のnodeValue; ?>

メタタグを見てみましょう。

あなたはのwhois の情報を使用することができます。あなたはきれいな方法でそれを行うようにするライブラリがあるはずです。あなたが使うことになる技術の種類言及didntの...

ライセンス: CC-BY-SA帰属
所属していません StackOverflow
scroll top