オンラインのユーザー エージェント データベースはありますか?
-
12-09-2019 - |
質問
ユーザー エージェント文字列はどのように解析しますか?私は取得しようとしています:
- ブラウザ
- ブラウザのバージョン
- OS
- OSバージョン
ユーザーエージェント文字列から。私のアプリは Perl で書かれており、以前は使用していました HTTP::ブラウザ検出. 。少し古いもので、もうメンテナンスされていません。(編集:その後更新されています。) 実際の検索に Perl を使用することに私はまったく縛られていません。
私は、自動魔法解析は無駄であるという結論に達しました。未分類の UA のリストを表示し、それらを手動で最新の状態に保つための、粗末なタイプのアプリを作成することを考えていました。
利用できるそのようなリソースはすでに存在しますか?HTTP 呼び出しを行ってユーザー エージェント情報を検索できれば素晴らしいでしょう。
ありがとう!
解決
useragentstring.com には、そのユーザーエージェント文字列のブラウザとOSの情報を持っています。独自の文字列を送信するための「分析」ボックスもあります。私はそれが自動的にフックアップすることがいかに簡単であるかわかりませんが、それはあなたが欲しい情報の並べ替えを持っているようだ。
オリジナル投稿(あなたupvotesを盗むためにしたくない)からのアップデート:の
私は http://useragentstring.com/するの作者からこの背中を得ました
私は、単純なAPIがありますが、私は約です 私のサイトの多くを再コーディング、それは可能性があります 近い将来変更されます。あなたがリンクしている場合 私のサイトに、あなたが送ることができます フォームフィールドにまたはでuseragentstring 'UAS' の名前を持つクエリ文字列ます:
<のhref = "http://www.useragentstring.com/?uas=Opera/9.70%20(Linux%20i686%20;%20U;%20en-us)%20Presto/2.2.0" のrel = "noreferrer"> http://www.useragentstring.com/?uas=Opera/9.70%20(Linuxでは%20i686%20;%20U;%20en-US)%20Presto / 2.2.0 の
これは自動に解析します 文字列。追加&のgetText場合=すべての
<のhref = "http://www.useragentstring.com/?uas=Opera/9.70%20(Linux%20i686%20;%20U;%20en-us)%20Presto/2.2.0&getText=all" REL = "noreferrer"> http://www.useragentstring.com/?uas=Opera/9.70%20(Linuxでは%20i686%20;%20U;%20en-US)%20Presto / 2.2.0&getTextに=すべての
あなたはキーでテキストファイルを取得します 以下のような値のペア AGENT_TYPE =ブラウザ; agent_nameに=オペラ; agent_version = 9.70 ...
他のヒント
ブラウザ機能のプロジェクト
のbrowscap.iniは多くの詳細を提供するデータベースです 名前、バージョンなどのブラウザとその機能、について、 ようにJavascriptをサポートしてます。
ブラウザの詳細の多くを提供します。browscap.ini、および 名前、バージョン、JavaScriptサポートなどとしての機能、 でます。
PHPのネイティブget_browser()関数は、このファイルを解析し、あなたを提供します すべてのブラウザの詳細に関する情報の完全なセットで、しかし、 それはで指定するのbrowscap.iniへのパスが必要です PHP_INI_SYSTEMとしてフラグ付けされるphp.iniのディレクティブbrowscapます。
私はUAのの検索可能なリストを探していました。 user-agents.orgは検索可能ですが、ほぼ十分なデータがありませんでした。私は http://www.botsvsbrowsers.com/ を発見しました。それは広告でいっぱいですが、まさに私が探していたした右側にある検索バーがあります。
このスレッドは数年前のものですが、ユーザー エージェントを検索するための新しいリソースがここにあります。 ua.theafh.net 540 万人のエージェントがいます。たとえば、ブラウザをフィルタリングし、ワイルドカード検索を使用できます。 http://ua.theafh.net/list.php?s=%22%2A%22&include=yes&class=abr&do=desc - 検索結果をCSVとしてダウンロードすることもできます
私はクモのこのJSONエンコードされたリストを見つけた/ボット https://github.com/ monperrus /クローラー・ユーザーエージェントには、定期的に2017のように更新されるように表示されます。
ほとんどの2017年に、リソースを更新します:
https://techblog.willshouse.com/ 2012/01/03 /最も一般的なユーザー・エージェント/ の
また、TXT形式で自分のリストを提供します。
私たちは、ソフトウェア、オペレーティングシステム、プラットフォーム、ハードウェアの種類、ソフトウェアの種類やレンダリングエンジンが主催するユーザーエージェントの巨大なデータベースを持っています:
https://developers.whatismybrowser.com/useragents/explore/する
他のすべてのユーザエージェントのリストは、私はこのリストを建てたときに、ユーザーのために、これは簡単に作ることは、それの設計の背後にある主要な優先事項の一つであった、関連するユーザーエージェントを閲覧することが容易となるのはかなり平均仕事をします。
また、あなたが私たちのユーザエージェントパーサにアクセスできるようになります無料のAPIにサインアップすることができます。
あなたは http://botopedia.org に使用することができます。また、なりすましを防ぐことができますIPの検証を提供しています。
以来更新されています。インストールしたら、ここであなたは、ユーザーエージェント文字列のテキストファイルを解析するためにそれを使用することができます方法は次のとおりです。
cat user_agent_strings.txt | perl -nE 'use HTTP::BrowserDetect; $ua = HTTP::BrowserDetect->new($_); say $ua->browser_string || "unknown";'