从表格中提取数据,网站不断在表格中输入新数据

时间:2019-10-07 16:56:08

标签: xpath web-scraping google-sheets google-sheets-formula google-sheets-importxml

我正在尝试将表格的数据导入Google表格。网站上的表格不断将新数据添加到顶部。 (最新贸易数据)。我真的对网络抓取和HTML代码陌生。我什至不确定我是在看正确的HTML元素还是在看XPath for ImportXML。

URL为: https://www.deribit.com/main#/options?tab=all

XPATH: //*[@id="tradesScrollC"]

Element: <div id="tradesScrollC" class="table-scrollable-deribit" style="max-height: 200px;overflow-y: auto" onscroll="BTCOptions.scrollTradesC(event);">
                            <table class="table table-hover table-condensed table-nopadding" float-thead="floatTheadOptions">
                                <thead>
                                <tr>
                                    <th ng-i18next="app.assets">Assets</th>
                                    <th ng-i18next="app.price">Price</th>
                                    <th ng-i18next="app.imp_v">IV</th>
                                    <th ng-i18next="app.Qty">Qty</th>
                                    <th ng-i18next="app.time">Date Time</th>
                                </tr>
                                </thead>
                                <tbody id="last_trades_call"></tbody>
                            </table>
                        </div>

我已经尝试了importXML和importHTML,但是,我不确定每个标签是什么以及我是否正确使用了它。

=IMPORTXML("https://www.deribit.com/main#/options?tab=all", "//div[@id='tradesScrollC']/table")

我想打印网站上更新的所有交易数据,也要打印在我的Google表格上。列标题与网站完全一样(资产价格IV数量日期时间)

1 个答案:

答案 0 :(得分:0)

它不是关于配方而是网站。您将需要找到另一种,因为Google表格无法抓取JavaScript内容。您可以通过禁用给定站点的JS来简单地进行检查,您会看到一个空白页面,如:

e


这就是您所能获得的:

public ActionResult Random()
{
    RandomMovieViewmodel rmvm = new RandomMovieViewmodel();
    return View(rmvm);
}

0


=ARRAY_CONSTRAIN(IMPORTXML("https://www.deribit.com/main#/options?tab=all", "//*"), 1000, 10)

0