我知道这是一个愚蠢的问题,但我无法找到它的问题。无法使用xpath
从html文档中的body节点获取内部文本。
我正在使用的代码:
HtmlWeb web = new HtmlWeb();
HtmlDocument doc = web.Load(String.Format(url, companyName));
HtmlNode node = doc.DocumentNode.SelectSingleNode("//body");
string code = null;
try
{
code = node.FirstChild.InnerText;
}
catch (NullReferenceException e)
{
}
网站结构:
<html>
<body>PYRIX | preston york</body>
</html>
答案 0 :(得分:0)
我刚试过node.InnerText
并且它有效。问题必须在于如何加载文档。
这有效:
HtmlDocument doc = new HtmlDocument();
doc.LoadHtml("<html><body>PYRIX | preston york</body></html>");
var node = doc.DocumentNode.SelectSingleNode("//body");
Console.WriteLine(node.InnerText);