Excel getElementById提取span类信息

时间:2013-05-17 22:28:46

标签: excel-vba vbscript vba excel

我需要使用VBA从HTML中提取某些信息。

这是我试图单独提取位置信息的HTML。

<dl id="headline" class="demographic-info adr">
<dt>Location</dt>
<dd>
<span class="locality">
      Dallas/Fort Worth Area
</span>
</dd>
<dt>Industry</dt>
    <dd class="industry">
           Higher Education
</dd>

在我的excel VBA中,打开网页后,我使用以下代码来提取信息。

Dim openedpage as String
openedpage = iedoc1.getElementById("headline").innerText

但是,我收到的信息是,

位置达拉斯/沃斯堡地区工业高等教育

我只需要提取,

达拉斯/沃斯堡地区作为输出。

1 个答案:

答案 0 :(得分:3)

尝试:iedoc1.getElementById("headline").getElementsByTagName("span")(0).innerText

你得到了所有额外的文字,因为这有点像你要求的那样,父元素的innerText,就是它里面的一切。

上面的代码获取“标题”元素的内容,然后查找其中的所有“span”标记。查看返回的列表,它选择第一个实例并返回innerText。

<强>更新 我似乎总是把索引库弄错了,我的示例中的1应该是0