我实施了一项要求“http://cnblogs.com”页面的功能 当我使用HtmlAgilityPack替换更多的HtmlNode时,却发生了一些混淆的事情-----它无法取代。
代码是:
using System;
using System.Collections.Generic;
using System.Linq;
using System.Net;
using System.Text;
using System.Threading.Tasks;
using HtmlAgilityPack;//I Use NuGet to include HtmlAgilityPack(Vs2012)
namespace CatchWebSample
{
class Program
{
public static void Main(string[] args)
{
HtmlDocument document = new HtmlDocument();
WebClient wc = new WebClient();
wc.Encoding = Encoding.GetEncoding("utf-8");
string content = wc.DownloadString("http://cnblogs.com");
document.LoadHtml(content);
string oldContent = document.DocumentNode.OuterHtml;
//here, I want to replace all xpath= //div[@class='post_item_foot'] htmlnodes
HtmlNodeCollection targetNodeCollection = document.DocumentNode.SelectNodes(@"//div[@class='post_item_foot']");
HtmlNode newHtmlNode;
if (targetNodeCollection != null && targetNodeCollection.Count > 0)
{
for (int i = 0; i < targetNodeCollection.Count; i++)
{
var targetNode = targetNodeCollection[i];
newHtmlNode = document.CreateElement("span");
newHtmlNode.InnerHtml = HtmlDocument.HtmlEncode("###### REPLACED CONTENT #########");
targetNode.ParentNode.ReplaceChild(newHtmlNode, targetNode);
}
content = document.DocumentNode.OuterHtml;
//but the result is same of the original data,why it can not replace ?
bool flag = string.Compare(oldContent, content) == 0;
}
}
}
}
我很困惑,为什么?
答案 0 :(得分:1)
replaceChild(),insertAfter()突然之间他们都停止了为我工作。
我最好的选择是用“new html string”替换innerhtml
number.value.valueForKey("countryCode") as? String
编辑
HtmlAgilityPack 插入值/节点时出现错误。由于一些缓存使其更快地工作。
这就是我放弃它的原因。并使用 AngleSharp 。修改强>
2017年中期正在开发 HAP here。我不会回去。你也不能在HAP上创造问题。