HTML评论提取器

时间:2010-10-22 12:10:36

标签: html security parsing

我很清楚用正则表达式解析HTML有很多警告和吵闹的对手。因此,我不是试图重新发明轮子,而是寻找一种工具,我可以指向一个网页并说“给我发表评论,b * tch”。

任何人都可以提供建议吗?

我正在阅读一些OWASP文档或安全博客,我几乎可以肯定我看到了一个执行此任务的工具。不幸的是,Google一直没有帮助。

干杯

2 个答案:

答案 0 :(得分:0)

如果您想要Java解决方案,请尝试HTMLParser并查找RemarkNode s。

答案 1 :(得分:0)

Mhhhhh ......我认为在谷歌搜索你使用的操作系统和一些聪明的关键字可以为你提供所需的一切。对于基于UNIX的系统,请查看:parse HTML with SED and PERL

对于Windows操作系统,我认为您可以搜索VBS(VBScript)。