我正在尝试使用htmlagilitypack获取网页源代码。这是获取源代码并填入多行文本框的代码:
var url = "http://www.example.com";
var web = new HtmlWeb();
var doc = web.Load(url);
sourcecodetxt.Text = doc.ToString();
代码工作正常,但如果我的网页上有一些“替换代码符号”,则符号会更改一些字符,例如:★
已更改为★
我的问题是如何获得原始符号。对不起,我的英语不好。提前谢谢。
答案 0 :(得分:1)
尝试使用WebClient
和HtmlDocument
' Load()
方法,以便指定编码:
WebClient client = new WebClient();
HtmlDocument doc = new HtmlDocument();
doc.Load(client.OpenRead("http://www.example.com"), Encoding.UTF8);