我正在尝试使用HtmlAgilityPack提取一些内部文本。以下是感兴趣的HTML:
<select name="Archives" onchange="javascript:setTimeout('__doPostBack(\'Archives\',\'\')', 0)" id="Archives" style="width:200px;">
<option selected="selected" value="Dashboard_Jul-2012">Dashboard_Jul-2012</option>
<option value="Dashboard_Jun-2012">Dashboard_Jun-2012</option>
</select>
我正在使用:
string output = htmlwriter.InnerWriter.ToString()
var doc = new HtmlDocument();
doc.LoadHtml(output);
string inner = doc.DocumentNode.SelectSingleNode("//option[@selected='selected']").InnerText;
但我得到的只是空字符串。
感谢任何建议。
问候。
答案 0 :(得分:5)
HTMLAgilityPack默认情况下将选项标记留空(您可以在HtmlAgilityPack -- Does <form> close itself for some reason?查看作者的原因)。要修复它,请在选择节点之前添加此行:
HtmlNode.ElementsFlags.Remove("option");