网页抓取:按javascript按钮

时间:2010-10-03 20:11:56

标签: python screen-scraping wget

我正在尝试抓取网页并收到我需要按下按钮的数据。这是按钮的源代码:

“a class =”press-me_btn“href =”javascript:void(NewPage ['DemoPage']。startDemo());“id =”js_press-me_btn“> PRESS ME

是否可以在不使用浏览器的情况下以某种方式“按下”按钮?要么使用带有--post-data参数的wget,要么使用小python,ruby,perl等应用程序?

感谢任何想法!

2 个答案:

答案 0 :(得分:1)

在这种情况下,这些不是按钮,它是anchor element,我认为你需要运行js代码,即在href属性中:

javascript:void( NewPage['DemoPage'].startDemo() );

答案 1 :(得分:1)

我们将iMacros用于web scraping,它可以按下各种按钮。它适用于Perl,Ruby等。

如果在Linux上,请尝试free/open source iMacros Firefox addon