如何从html元素类vb.net获取文本?

时间:2016-05-01 23:07:26

标签: html vb.net

我有这个元素

<div id="cp-0" class="caption-line" data-time="19.5">
   <div class="caption-line-time">0:19</div>
   <div class="caption-line-text">I used to bite my tongue and hold my breath Scared to rock the boat and make a mess</div>             
</div>

我想要

0:19
I used to bite my tongue and hold my breath Scared to rock the boat and make a mess

2 个答案:

答案 0 :(得分:2)

您需要的是InnerText的{​​{1}}属性。

详细信息和示例程序:
https://msdn.microsoft.com/en-us/library/system.xml.xmlelement.innertext%28v=vs.110%29.aspx

<强>更新
您也可以使用HtmlElement类型。它还具有InnerText属性。

您还可以通过将XmlElement强制转换为其中一个非托管MSHTML界面来访问内部文本,例如: IHTMLElement具有innerText属性。

您必须为项目添加HtmlElement COM引用 (文件名为Microsoft HTML Object Library。)

以下是一个例子:

mshtml.tlb

答案 1 :(得分:0)

感谢所有我通过这个解决它

    If SaveFileDialog1.ShowDialog = DialogResult.OK Then
             FileOpen(1, SaveFileDialog1.FileName, OpenMode.Output)
           For Each telement As HtmlElement In WebBrowser1.Document.GetElementsByTagName("div")
            Dim tElementClass As String = "caption-line-time"
            Dim selementclass As String = "caption-line-text"
            If telement.OuterHtml.Contains(tElementClass) AndAlso telement.OuterHtml.Contains(selementclass) Then
            Dim conStr As String = telement.GetAttribute("innertext")
            PrintLine(1, conStr)

            End If
               Next
   End If


        FileClose(1)

    End If