如何获取网页上的字体大小?

时间:2009-06-19 20:53:10

标签: parsing web-crawler render

在webspiders / crawlers中,我如何获得用户在HTML文档中看到的字体的实际初始渲染大小,记住CSS。

2 个答案:

答案 0 :(得分:3)

呈现文字大小? 用户可以使用他/她的浏览器设置随意更改文本大小。 更不用说不同的浏览器以不同的方式呈现相同的内容。

答案 1 :(得分:0)

如果您对“默认”的答案感到满意,没有用户自定义视图(这似乎很可能),我相信您正在考虑一个相当痛苦的情况:

  • 使用CSS嵌入渲染引擎 支持你的蜘蛛。喜欢 使用最匹配的发动机 您的用户,或者使用 所有三种常见的引擎和商店 所有这些信息。该 嵌入的容易程度差异很大 你的消费技术。

  • 加载正在蜘蛛网中的URI 渲染引擎。

  • 使用引擎的API,查询它 元素的字体指标 包含你考虑的东西 代表性文本(选择此为 我甚至都不会参加的运动 开始预测策略)。你怎么 访问这将完全取决于 你的嵌入场景 发动机。

我希望这是'艰难的方式',但我不确定是否有'简单'的方法。