答案 0 :(得分:3)
这是非常主观的,取决于网站,并非所有网站都是平等的。你似乎在寻找一般答案。
要获取图标,请执行curl请求以获取页面html,然后解析它,查找链接标记rel =“快捷方式图标”:
<link rel="shortcut icon" href="https://ssl.gstatic.com/ui/v1/icons/mail/images/favicon5.ico" type="image/x-icon">
如果找不到,请尝试对example.com/favicon.ico执行curl请求,因为这是大多数浏览器自动退回的默认设置。然后,您可以尝试选择页面中的第一张图像。
对于标题,您可以查找
<title>Example Title</title>
标签或描述元标记。
所有这些事情只会到目前为止。不同的网站会有不同的结果。没有完整的解决方案,因为并非所有网站都是平等的。我会说这是一个很好的起点,根据你的应用,我会说,储存一个映射到图标和标题的常用域列表可能是有利的。