我正在尝试从HTML页面中提取特定内容(链接,文本,图像)。是否有一些程序可用于生成页面DOM模型的可视化表示?我知道我可以使用HTML解析器在Java中编写这样的程序,但在我这样做之前,我想我会看看是否已经存在这样的程序。
我的主要目标是提取某些链接,图片网址和文字;并将这些发送到页面上的Flex小程序。 谢谢, 万斯
答案 0 :(得分:1)
如果您只想提取一些信息(而不是打印整个页面结构),您可以使用Firefox的FireBug扩展。
选择HTML选项卡,然后单击左侧的第二个图标(看起来像一个指向框的光标),然后单击您感兴趣的页面部分,转到DOM的那一部分。
答案 1 :(得分:0)
我认为你最好的选择是jQuery和GreaseMonkey ...... GreaseMonkey会插入脚本,而jQuery可以有效地解析HTML DOM。请注意,这可能只是FireFox的解决方案,因为我认为GreaseMonkey是一个仅限FireFox的实用程序。