如何使用python在网页上提取动态时间计数器

时间:2012-01-24 05:29:51

标签: javascript python web-scraping beautifulsoup

我在python中使用BeautifulSoup抓取一些网站。我偶然发现了一个我要提取的网站中的倒数计时器。计时器显示网站上某些信息的剩余时间。一些javascript方法每秒触发innerHTML。有谁知道如何提取它?

1 个答案:

答案 0 :(得分:0)

我不知道为什么你会想要屏幕显示,因为大量的免费Javascript倒计时器代码只是谷歌搜索。这是Robert Hashemian最喜欢的一个:http://www.hashemian.com/tools/javascript-countdown.htm

但是如果你还想抓它,你需要查看网站的HTML源代码。如果计时器的javascript嵌入在文档中,您必须找到开头和结尾的<script></script>标签,并复制其间的所有内容(这实际上会破坏您自动抓取的点,因为您拥有无论如何要追捕剧本)。如果脚本位于外部js文件中(更有可能),最好只下载文件。