加载html时C#HtmlAgilityPack编码问题

时间:2019-09-18 20:00:01

标签: c# xml encoding utf-8 html-agility-pack

我正在使用HTMLAGILITYPACK从HTML本地页面提取所有数据,但是仍然存在特殊字符的问题……请看一下:https://prnt.sc/p7xegw(我不能使用〜,`,´,ç和其他)。

这是我用来调用HTML页面的代码:

System.IO.StreamReader myFile = new System.IO.StreamReader("C:/Users/Dev-02/Desktop/Daniel/xml_project/schemaproject/portal.html");

string arquivohtml = myFile.ReadToEnd();
HtmlAgilityPack.HtmlDocument doc = new HtmlAgilityPack.HtmlDocument();

doc.LoadHtml(arquivohtml);

在调用HTML页面时是否可以设置编码?

1 个答案:

答案 0 :(得分:2)

您需要将编码传递给StreamReader构造函数,该构造函数将解析文件的字节。