将特定HTML元素从网页复制到Excel

时间:2014-12-19 15:09:48

标签: html excel loops web-scraping

我正在尝试自动完成从某个网站到Excel的相当基本的复制和粘贴。要访问所需的网页,我必须从网页上的组合框中选择特定项目。我管理过这部分:

Sub CopyThat()
Dim IE As Object
Dim htmlButton

Set IE = CreateObject("internetexplorer.application")

IE.Visible = True
IE.navigate "http://www.uvo.gov.sk/evestnik/-/vestnik/search"

While IE.Busy
    DoEvents
Wend

IE.Document.getElementById("druhOznamenia").Value = "6"
IE.Document.getElementById("druhZakazky").Value = "0"
IE.Document.getElementById("druhPostupu").Value = "0"
IE.Document.getElementById("datumZverejneniaOd").Value = "01.07.2013"
IE.Document.getElementById("datumZverejneniaDo").Value = "30.11.2014"
Set tags = IE.Document.getElementsByTagName("Input")

For Each tagx In tags
    If tagx.Type = "submit" And tagx.Value = "H¾adaj" Then
        tagx.Click
    End If
Next

End Sub

现在我正在尝试查看HTML源代码中的div类并复制特定类下的所有文本。在这种情况下,我正在寻找的数据代码如下所示:

div class="oznamenie" > <div class="ozn1"> <a href="http://www.uvo.gov.sk/evestnik/-           /vestnik/275652" >28776 - MST</a> <span class="datum">Zverejnené: 28.11.2014 vo VVO 233/2014 </span> </div> <div class="ozn2" title="URBÁRI, s.r.o."> URBÁRI, s.r.o. </div> <div class="ozn3" title="Dodávka technológie pre spoločnosť URBÁRI, s.r.o." > Dodávka technológie pre spoločnosť URBÁRI, s.r.o. </div> </div>

我正在尝试将文本从ozn1复制到Excel工作表和单元格A2,将ozn2文本复制到B2和ozn3文本到P2。这是我卡住的地方,因为我不知道如何遍历每个div类并将它们复制到这些行中。然后代码应该查看下一个ozn1并将其复制到A3,B3,P3等。然后宏应该在该页面上复制所有ozn1s,ozn2s和ozn3s后,移到网站的下一页并执行相同操作。

第二部分是打开特定链接(在本例中为http://www.uvo.gov.sk/evestnik/-/vestnik/275652)并复制更多文本并放入Excel中。

我知道有很多未完成的东西,除了打开我需要的网页之外我什么也没做,但是如果你能给我任何关于如何继续的建议我会非常感激。

提前感谢您的帮助。

0 个答案:

没有答案