如何解析用户代理字符串?我希望得到:
。我的应用程序是用perl编写的,之前使用的是HTTP::BrowserDetect。它有点陈旧,不再维护。 (编辑:它已被更新。)我与使用perl进行实际查找无关。
我得出的结论是,自动解析是一个失败的原因。我正在考虑编写一个crud类型的应用程序,向我展示一个未分类的UA列表,并手动保持它们是最新的。
我可以使用这样的资源吗?如果我可以进行HTTP调用以查找用户代理信息,那将是非常棒的。
谢谢!
答案 0 :(得分:22)
useragentstring.com具有用户代理字符串的浏览器和操作系统信息。还有一个“分析”框来提交自己的字符串。我不知道自动连接是多么容易,但它似乎有你想要的那种信息。
从原始发布更新(不想窃取你的赞成票):
我从http://useragentstring.com/的作者那里得到了回复:
我有一个简单的API,但我很乐意 重新编码我的很多网站,所以它可能 在不久的将来改变。如果你链接 到我的网站,你可以发送一个 表单字段或中的useragentstring 名为'uas'的查询字符串:
http://www.useragentstring.com/?uas=Opera/9.70%20(Linux%20i686%20;%20U;%20en-us)%20Presto/2.2.0
这会自动解析 串。如果你添加& getText = all
您将获得一个带密钥的文本文件 价值对就像 AGENT_TYPE =浏览器; AGENT_NAME =歌剧; AGENT_VERSION = 9.70 ...
答案 1 :(得分:4)
答案 2 :(得分:4)
browscap.ini文件是一个提供大量详细信息的数据库 关于浏览器及其功能,例如名称,版本, Javascript支持等等。
browscap.ini,它提供了很多关于浏览器的细节 他们的能力,如名称,版本,Javascript支持等 上。
PHP的本机get_browser()函数解析此文件并为您提供 提供有关每个浏览器详细信息的完整信息,但是 它需要在。中指定browscap.ini文件的路径 php.ini browscap指令,标记为PHP_INI_SYSTEM。
答案 3 :(得分:3)
我正在寻找可搜索的UA列表。 user-agents.org是可搜索的,但没有足够的数据。我找到了http://www.botsvsbrowsers.com/。广告杂乱无章,但右侧有一个搜索栏,正是我正在寻找的。 p>
答案 4 :(得分:3)
此主题已有几年历史,但这里是搜索用户代理的新资源:ua.theafh.net,拥有540万个代理。例如,您可以过滤浏览器并使用通配符搜索:http://ua.theafh.net/list.php?s=%22%2A%22&include=yes&class=abr&do=desc - 也可以将搜索结果下载为CSV
答案 5 :(得分:1)
答案 6 :(得分:1)
我们拥有庞大的用户代理数据库,由软件,操作系统,平台,硬件类型,软件类型和渲染引擎组织:
https://developers.whatismybrowser.com/useragents/explore/
所有其他用户代理商列表都可以轻松浏览相关的用户代理,因此当我构建此列表时,为用户提供这些功能是设计它的主要优先事项之一。
您还可以注册免费的API,以便访问我们的用户代理解析器。
答案 7 :(得分:1)
我发现这个JSON编码的蜘蛛/机器人https://github.com/monperrus/crawler-user-agents列表似乎定于2017年定期更新。
答案 8 :(得分:0)
您可以使用http://botopedia.org。它还提供IP验证,有助于防止欺骗。
答案 9 :(得分:0)
自您发布问题以来,HTTP::BrowserDetect已更新。安装后,您可以使用它来解析用户代理字符串的文本文件:
cat user_agent_strings.txt | perl -nE 'use HTTP::BrowserDetect; $ua = HTTP::BrowserDetect->new($_); say $ua->browser_string || "unknown";'