我正在尝试从this网站提取数据,以某种方式,我从尝试获取的任何文本中什么都得不到。 我正在使用Xidel抓取数据。
xidel -e '//span[@class="main-price"]/text()' 'https://www.tokopedia.com/emas/harga-hari-ini'
**** Retrieving (GET): https://www.tokopedia.com/emas/harga-hari-ini ****
**** Processing: https://www.tokopedia.com/emas/harga-hari-ini/ ****
它至少应返回Rp
或一些数字。但是我不确定为什么它返回null。我正在尝试的另一个网站就很好。
答案 0 :(得分:1)
目标网站是使用javascript动态加载内容的网站之一。确认它的一种简单方法是转到页面,进行查看,然后在浏览器中禁用javascript并重新加载页面。对于此特定页面,您会看到它完全空白。
有两种方法可以处理它,但是除非我非常误解,否则xidel并不是其中一种。 Start by taking a look at this.