我在字符串中解析了一个html代码。我想读取字符串中的表标记并单独读取它,然后将其存储到JSON文件中。 如果我尝试导出JSON,整个html代码转到JSON,我无法识别表标记。 我是否可以直接解释StreamReader用于此目的,或者我需要将解析后的HTML保存为字符串,然后执行我需要的操作。
答案 0 :(得分:2)
使用HtmlAgilityPack库解析HTML并将需要保存的内容提取到单独的文件中。
即
var doc = new HtmlAgilityPack.HtmlDocument();
doc.LoadHtml(htmltablestring);
foreach (HtmlNode table in doc.DocumentNode.SelectNodes("//table[@id='table2']")) {
streamWriter.WriteLine(table.OuterHtml);
}
新项目网址:http://html-agility-pack.net
http://www.codeproject.com/Articles/659019/Scraping-HTML-DOM-elements-using-HtmlAgilityPack-H