我目前正在学习如何使用python和beautifulsoup进行网络抓取,而且我遇到了一些问题。这是problem page的链接。在所有书籍列表的底部,有一些文字可以读到" Pages"然后是一个数字列表,这些数字是继续查看其余书籍的页码。单击每个数字时,它会使用一组新书更新页面,但是当我检查其中一个页码元素时,我看到的是:
<a href="#" data-page="3">3</a>
我目前正在尝试模拟当您点击其中一个数字时发生的情况,并使用一组新书更新页面。但是,我不知道如何做到这一点,因为没有url链接,没有其他任何暗示如何使用新页面更新DOM。
我认为该网站正在执行类似于this guy所做的事情,其中解释说他实际上是使用a标签作为按钮。
如果有人对此处发生的事情有任何其他信息,我将非常感激!
感谢您的帮助!