我在python中使用BeautifulSoup
抓取一些网站。我偶然发现了一个我要提取的网站中的倒数计时器。计时器显示网站上某些信息的剩余时间。一些javascript方法每秒触发innerHTML
。有谁知道如何提取它?
答案 0 :(得分:0)
我不知道为什么你会想要屏幕显示,因为大量的免费Javascript倒计时器代码只是谷歌搜索。这是Robert Hashemian最喜欢的一个:http://www.hashemian.com/tools/javascript-countdown.htm
但是如果你还想抓它,你需要查看网站的HTML源代码。如果计时器的javascript嵌入在文档中,您必须找到开头和结尾的<script>
和</script>
标签,并复制其间的所有内容(这实际上会破坏您自动抓取的点,因为您拥有无论如何要追捕剧本)。如果脚本位于外部js文件中(更有可能),最好只下载文件。