我正在学习如何第一次使用该库,并希望得到一些帮助。
考虑一下我在HTMLDocument中的某个地方:
<h1>Casablanca
<span>(<a href="/year/2010/">2010</a>) <span class="pro-link"><a href="http://pro.imdb.com/rg/maindetails-title/tconst-pro-header-link/title/tt1226229/">More at <strong>IMDbPro</strong></a> »</span><span class="title-extra"></span></span>
</h1>
如何只提取Casablanca文本,而不是span div?
另外,我认为HtmlNode.InnerText是Div内的文本是否正确?
答案 0 :(得分:0)
好吧,将有一个TextNode作为H1节点的第一个子节点。
YourH1Node.FirstChild.InnerText
或类似的东西......