如何从Java中的给定URL获取html节点的所有使用的css属性

时间:2011-06-20 10:47:21

标签: java dom browser html-parsing web-crawler

给定一个url,我需要为html节点使用所有使用的css属性,包括那些根据节点属性从css文件派生的属性。 java中有什么东西可以做到这一点吗? 或者我可以在java 中运行 Web浏览器实例,因此通过在此浏览器实例中运行javascript来收集css属性吗?

1 个答案:

答案 0 :(得分:0)

如果您的应用程序中的性能至关重要,那么我建议您不要使用浏览器控件。那么你应该采取以下步骤

1)下载您的网页源代码
2)找到标题或正文中的所有样式文件,并在html源中找到所有内联样式
3)下载所有css文件并将它们送到CssParser(如@PeterMmm建议)来创建css结构
4)如果你想计算一个节点最终的css,你应该从根节点开始,找到适用于它的所有规则并使用标准计算样式

http://www.w3.org/TR/CSS2/cascade.html