使用asp.net c#

时间:2018-04-27 09:14:13

标签: c# asp.net html-agility-pack

我正在尝试使用htmlagilitypack获取网页源代码。这是获取源代码并填入多行文本框的代码:

var url = "http://www.example.com";
var web = new HtmlWeb();
var doc = web.Load(url);
sourcecodetxt.Text = doc.ToString();

代码工作正常,但如果我的网页上有一些“替换代码符号”,则符号会更改一些字符,例如:已更改为★ 我的问题是如何获得原始符号。对不起,我的英语不好。提前谢谢。

1 个答案:

答案 0 :(得分:1)

尝试使用WebClientHtmlDocument' Load()方法,以便指定编码:

WebClient client = new WebClient();
HtmlDocument doc = new HtmlDocument();
doc.Load(client.OpenRead("http://www.example.com"), Encoding.UTF8);