我需要实现VIPS算法,该算法是基于视觉的网页细分。所以,我需要一个工具来渲染一个html页面。以下是我的要求:
我想知道html页面中任何字符的颜色。
对于html中的任何标签,如果它有可以在浏览器上显示的内容,我想知道内容的位置,这意味着在浏览器上开始坐标和结束坐标。
因为所有页面都是通过我的抓取工具下载的。 Webkit是否能够处理存储为本地文件的页面?
我的项目是用Java开发的。 webkit的哪个端口适合?
http://weblogs.java.net/blog/ixmal/archive/2008/05/introducing_jwe.html 在这个链接上,据说: “WebKit体系结构由两个相当大的部分组成。第一个是跨平台的,它负责解析文档,生成DOM,支持JavaScript。另一部分,依赖于平台,所谓的”端口“,用于与网络通信,在屏幕和其他设备上呈现图形内容,事件处理和其他功能.JWebPane是一个Java端口,其中所有跨平台调用都是用Java实现的。“ 基于此,看起来第二部分对我来说没用,第一部分可以满足我的所有要求,我可以使用第一部分吗?
任何人都可以帮助我吗?如果可能的话,请给我一些示例代码,因为我找不到任何关于如何使用webkit的文档。谢谢!
为我可怜的英语道歉!