使用VBA通过<br/>在TD标签内分开文本

时间:2016-04-26 11:39:02

标签: html vba excel-vba web-scraping excel

我使用此代码获取TD标记

Set TDElement = oHtml.getElementsByTagName("tr")(6).getElementsByTagName("td")(18)

这将返回TD标签的全文。

Text1
Text2
Text3

我想要做的是在<br></br>

之前获取每个单独的字符串

这是HTML页面:

<td class="Td" nowrap="" valign="top">
  text1<br></br>
  text2<br></br>
  text3<br></br>
</td>

如何在 TD 标记

中迭代此字符串

2 个答案:

答案 0 :(得分:1)

像......那样的东西。

    dim strSplit() as string
    dim intCounter as integer
    dim strSelection as string

    strHTML=replace(strHTML,"<br>","")
    strSplit=split(strHTML,"</br>")

    for intCounter=0 to ubound(strSplit)
        strSelection = strSplit(intCounter)
    next intCounter

答案 1 :(得分:1)

br不是HTML页面的元素,因此无法指向。

这意味着换行(换行)。

因此,在您的示例中,如果您获得innerText这个标签td,例如:

IE.document.getElementsByTagName("td")(**this td number**).innerText 

您将得到:

text1

text2

text3 (Note lines in between)

您将必须提取td标记的内部文本,并使用String操作以换行符作为分隔符将其拆分为3个字符串。