我需要使用VBA从HTML中提取某些信息。
这是我试图单独提取位置信息的HTML。
<dl id="headline" class="demographic-info adr">
<dt>Location</dt>
<dd>
<span class="locality">
Dallas/Fort Worth Area
</span>
</dd>
<dt>Industry</dt>
<dd class="industry">
Higher Education
</dd>
在我的excel VBA中,打开网页后,我使用以下代码来提取信息。
Dim openedpage as String
openedpage = iedoc1.getElementById("headline").innerText
但是,我收到的信息是,
位置达拉斯/沃斯堡地区工业高等教育
我只需要提取,
达拉斯/沃斯堡地区作为输出。
答案 0 :(得分:3)
尝试:iedoc1.getElementById("headline").getElementsByTagName("span")(0).innerText
你得到了所有额外的文字,因为这有点像你要求的那样,父元素的innerText,就是它里面的一切。
上面的代码获取“标题”元素的内容,然后查找其中的所有“span”标记。查看返回的列表,它选择第一个实例并返回innerText。
<强>更新强>
我似乎总是把索引库弄错了,我的示例中的1
应该是0