Существует ли онлайн-база данных агента пользователя?
-
12-09-2019 - |
Вопрос
Как вы анализируете строки вашего пользовательского агента?Я хочу получить:
- Браузер
- Версия браузера
- Операционная система
- Версия операционной системы
из строки пользовательского агента.Мое приложение написано на perl и ранее использовало HTTP::BrowserDetect.Он немного устарел и больше не поддерживается.(Редактировать:с тех пор он был обновлен.) Я никоим образом не привязан к использованию perl для фактического поиска.
Я пришел к выводу, что автоматический синтаксический анализ - гиблое дело.Я подумывал о написании приложения типа crud, которое показывало бы мне список неклассифицированных пользователей и вручную поддерживало бы их в актуальном состоянии.
Существует ли уже такой ресурс, к которому я могу подключиться?Было бы здорово, если бы я мог выполнить HTTP-вызов для поиска информации об агенте пользователя.
Спасибо!
Решение
useragentstring.com содержит информацию о браузере и операционной системе для строк пользовательского агента.Там также есть поле "проанализировать", чтобы отправить свою собственную строку.Я не знаю, насколько легко подключиться к нему автоматически, но, похоже, в нем есть именно та информация, которая вам нужна.
Обновление с оригинальной публикации (не хочу красть ваши положительные отзывы):
Я получил это обратно от автора книги http://useragentstring.com/:
У меня простой API, но я собираюсь перекодировать большую часть своего сайта, так что это может измениться в ближайшем будущем.Если вы ссылаетесь на мой сайт, вы можете отправить useragentstring в поле формы или в строку запроса с именем 'uas':
http://www.useragentstring.com/?uas=Opera/9.70%20 (Linux%20i686%20;%20U;%20en-us)%20Presto/2.2.0
это приведет к автоматическому анализу строки .если вы добавите &getText=все
вы получите текстовый файл с парами ключ значение, такими как agent_type=Браузер;agent_name=Opera;agent_version=9.70...
Другие советы
Проект возможностей браузера
Файл browscap.ini - это база данных, которая предоставляет множество подробностей о браузерах и их возможностях, таких как название, версии, Поддержка Javascript и так далее.
browscap.ini, который предоставляет множество подробностей о браузерах и их возможностях, таких как название, версии, поддержка Javascript и так далее .
Встроенная функция get_browser() PHP анализирует этот файл и предоставляет вам полный набор сведений о деталях каждого браузера, но для этого требуется указать путь к файлу browscap.ini в директива браузера php.ini, которая помечена как PHP_INI_SYSTEM.
Я искал список UA с возможностью поиска.user-agents.org доступен для поиска, но на нем недостаточно данных.я нашел http://www.botsvsbrowsers.com/.Он завален рекламой, но с правой стороны есть панель поиска, именно то, что я искал.
Этой теме уже несколько лет, но вот новый ресурс по поиску пользовательских агентов: ua.theafh.net с 5,4 миллионами агентов.Например, вы можете отфильтровать браузеры и использовать поиск по подстановочным знакам: http://ua.theafh.net/list.php?s=%22%2A%22&include=yes&class=abr&do=desc - также есть возможность загрузить результаты поиска в формате CSV
Я нашел этот список пауков/ботов в формате JSON. https://github.com/monperrus/crawler-user-agents кажется, регулярно обновляется с 2017 года.
Самый обновляемый ресурс в 2017 году:
https://techblog.willshouse.com/2012/01/03/most-common-user-agents/
Они также предоставляют свой список в формате TXT.
У нас есть огромная база данных пользовательских агентов, организованная по программному обеспечению, операционной системе, платформе, типу оборудования, типу программного обеспечения и механизму рендеринга:
https://developers.whatismybrowser.com/useragents/explore/
Все остальные списки пользовательских агентов выполняют довольно посредственную работу по упрощению просмотра связанных пользовательских агентов, поэтому, когда я создавал этот список, обеспечение удобства для пользователей было одним из основных приоритетов его разработки.
Вы также можете подписаться на бесплатный API, который предоставит вам доступ к нашему анализатору пользовательского агента.
Вы можете использовать http://botopedia.org.Он также предлагает проверку IP, которая помогает предотвратить подделку.
Поскольку вы разместили свой вопрос, HTTP::Браузердетект с тех пор был обновлен.После установки вы можете использовать его для анализа текстового файла строк пользовательского агента:
cat user_agent_strings.txt | perl -nE 'use HTTP::BrowserDetect; $ua = HTTP::BrowserDetect->new($_); say $ua->browser_string || "unknown";'