如何从网站上抓取信息

时间:2017-11-20 12:49:12

标签: vba web-scraping

我设法浏览网站并进行选择,但现在我需要将信息写入我的工作表,我不确定如何继续。 HTML如下: -

<div id="VisibleVehicles" class="filtered-vehicles">

                                                <div class="vehicle box-shadow-dark-2" data-id="86"
                                                     data-vehiclegroup="T"
                                                     data-vehicletitle="KIA PICANTO"
                                                     data-vehicleluggage="1"
                                                     data-vehicledoors="5"
                                                     data-vehiclepassengers="4"
                                                     data-vehicletransmission="M"
                                                     data-vehcileaircon="&#10004;"
                                                     data-standardwaiverratefee="4032.00"
                                                     data-superwaiverratefee="5216.00"
                                                     data-carsize="1"
                                                     data-transmission="manual"
                                                     data-vehicleaccriscode="MDMR"
                                                     data-norder="1">
                                                    <div class="vehicle-image">
                                                        <h4>
                                                            Group <text class="vehicle-group">T</text><br />
                                                            <text class="vehicle-title">KIA PICANTO

我需要的信息是vehiclegroup,vehicletitle,standardwaiverratefee,superwaiverratefee。我假设您使用.getElementsByClassName("filtered - vehicles"),但我不知道如何通过迭代来获取我需要的信息。

1 个答案:

答案 0 :(得分:2)

运行它并让我知道它在相应的列中打印了什么。因为我没有机会玩这个真实的网络。这是假设的:

Dim post As Object
For Each post In html.getElementsByClassName("filtered-vehicles")(0).getElementsByClassName("vehicle box-shadow-dark-2")
   R = R + 1: Cells(R, 1) = post.getAttribute("data-vehiclegroup")
   Cells(R, 2) = post.getAttribute("data-vehicletitle")
   Cells(R, 3) = post.getAttribute("data-standardwaiverratefee")
   Cells(R, 4) = post.getAttribute("superwaiverratefee")
Next post

顺便说一下,上面的代码用于IE而不是xmlhttp请求。