使用HtmlAgilityPack选择内部文本

时间:2012-08-21 16:40:55

标签: c# html html-agility-pack

我正在尝试使用HtmlAgilityPack提取一些内部文本。以下是感兴趣的HTML:

<select name="Archives" onchange="javascript:setTimeout(&#39;__doPostBack(\&#39;Archives\&#39;,\&#39;\&#39;)&#39;, 0)" id="Archives" style="width:200px;">
    <option selected="selected" value="Dashboard_Jul-2012">Dashboard_Jul-2012</option>
    <option value="Dashboard_Jun-2012">Dashboard_Jun-2012</option>
</select>

我正在使用:

string output = htmlwriter.InnerWriter.ToString()
var doc = new HtmlDocument();
doc.LoadHtml(output);
string inner = doc.DocumentNode.SelectSingleNode("//option[@selected='selected']").InnerText;

但我得到的只是空字符串。

感谢任何建议。

问候。

1 个答案:

答案 0 :(得分:5)

HTMLAgilityPack默认情况下将选项标记留空(您可以在HtmlAgilityPack -- Does <form> close itself for some reason?查看作者的原因)。要修复它,请在选择节点之前添加此行:

HtmlNode.ElementsFlags.Remove("option");