我解析html使用Html Agility Pack和Grate的东西 但我遇到了一些不好的事情:| 这是我的背景代码
public static HtmlDocument GetXHtmlFromUri2(string uri)
{
HttpClient client = HttpClientFactory.Create(new CustomeHeaderHandler());
var htmlDoc = new HtmlDocument()
{
OptionCheckSyntax = true,
OptionFixNestedTags = true,
OptionAutoCloseOnEnd = true,
OptionReadEncoding = true,
OptionDefaultStreamEncoding = Encoding.UTF8,
};
htmlDoc.LoadHtml(client.GetStringAsync(uri).Result);
return htmlDoc;
}
我对WebApi(Mvc4)使用html敏捷性,这是Get Method Logic
//GET api/values
public string GetHtmlFlights()
{
var result = ClientFlightTabale.GetXHtmlFromUri2("http://ikiafids.ir/departureFA.html");
HtmlNode node = result.DocumentNode.SelectSingleNode("//table[1]/tbody/tr[1]");
string temp = node.FirstChild.InnerHtml.Trim();
return temp;
}
但是当我调用此方法(来自Browser and Fiddler)遇到异常时,使用此主题:
对象引用未设置为对象的实例,此异常涉及此行
string temp = node.FirstChild.InnerHtml.Trim();
有人可以帮我吗?
答案 0 :(得分:3)
我认为你正在寻找这样的东西:
var result = ClientFlightTabale.GetXHtmlFromUri2("http://ikiafids.ir/departureFA.html");
var tableNode = result.DocumentNode.SelectSingleNode("//table[1]");
var titles = tableNode.Descendants("th")
.Select(th => th.InnerText)
.ToList();
var table = tableNode.Descendants("tr").Skip(1)
.Select(tr => tr.Descendants("td")
.Select(td => td.InnerText)
.ToList())
.ToList();
答案 1 :(得分:1)
我认为你的选择器错了。试试这个吗?
result.DocumentNode.SelectSingleNode("//table/tr[1]")