如何从网址获取元数据(图标和网站名称)?

时间:2016-02-03 19:08:46

标签: android url

如何从网址获取元数据(图标和网站名称)?

enter image description here

1 个答案:

答案 0 :(得分:3)

这是非常主观的,取决于网站,并非所有网站都是平等的。你似乎在寻找一般答案。

要获取图标,请执行curl请求以获取页面html,然后解析它,查找链接标记rel =“快捷方式图标”:

<link rel="shortcut icon" href="https://ssl.gstatic.com/ui/v1/icons/mail/images/favicon5.ico" type="image/x-icon">

如果找不到,请尝试对example.com/favicon.ico执行curl请求,因为这是大多数浏览器自动退回的默认设置。然后,您可以尝试选择页面中的第一张图像。

对于标题,您可以查找

<title>Example Title</title>

标签或描述元标记。

所有这些事情只会到目前为止。不同的网站会有不同的结果。没有完整的解决方案,因为并非所有网站都是平等的。我会说这是一个很好的起点,根据你的应用,我会说,储存一个映射到图标和标题的常用域列表可能是有利的。