我正在获取一个URL,并通过调用以下内容获取所有内容:
CQ dom = ...;
string content = dom.Text();
我注意到“Text()”方法也提取HTML注释,如:
<html>
<body>
<!-- This is comment - Ignore me -->
</body>
</html>
我正在寻找一些从代码中删除所有评论的选项。像这样:
dom["comment"].remove();
这可能吗?
由于
答案 0 :(得分:2)
找到解决方案。
dom的创建应该像这样:
CQ.Create(stream, Encoding.UTF8, HtmlParsingMode.Auto, HtmlParsingOptions.IgnoreComments);
我正在寻找HtmlParsingOptions.IgnoreComments 。