使用Html-Agility-Pack获取语言标记

时间:2018-04-20 18:42:07

标签: c# html-agility-pack

我想通过html-agility-pack从html标签中获取ISO语言代码 我的代码看起来像

var web = new HtmlWeb
{
  UserAgent = "[Mozilla/5.0 (Windows NT 10.0; Win64; x64; rv:59.0) Gecko/20100101 Firefox/10.0]"
};
var doc = web.Load(url);
string lang = doc.DocumentNode.SelectSingleNode("//html").InnerText;

但这当然是完整的html内容 那么如何输入这些标签?

<html lang="en">

编辑: DocumnetNode没有Attributres enter image description here

1 个答案:

答案 0 :(得分:1)

您应该能够使用以下代码获取语言。它将获取html节点并获取lang属性的值。

string language = doc.DocumentNode.SelectSingleNode("//html").Attributes["lang"].Value;