VBA,从HTML

时间:2016-09-29 13:17:34

标签: html vba excel-vba excel

您好我需要从HTML中提取特定行(例如必需的行),使用VBA并排除某些标记(例如span标记)。 这是HTML示例:

<div id="main-content">
     <span>...sometext</span>
     required text 1
     required text 2
     <span>...sometext</span>
</div>

这是我的VBA代码:

Excel.ActiveWorkbook.ActiveSheet.Cells(11, 11).Value = doc2.GetElementById("main_content").innertext

显然这会返回:

...sometext
required text 1
required text 2
...sometext

因此,我对这个具体例子的问题是如何提取&#34;所需的文本i&#34; (没有标签),没有&#34; ... sometext&#34; (包含在span标签中)?

由于

1 个答案:

答案 0 :(得分:0)

Split(Split(doc2.GetElementById("main_content").innerHTML, "</span>")(1), "<span>")(0)