Ruby使用/ dynamic内容获取HTML源代码

时间:2012-06-08 12:59:51

标签: ruby

我正在尝试加载页面的动态内容以及静态HTML。例如,在http://www.balsamiq.com/,如果我只是加载HTML,它将缺少页面底部的大型推荐框。我知道我可以使用

加载html
html = open(url).read

但同样,这将缺少页面加载时显示的动态内容。如何获得与查看网站时人类获得的完整HTML相匹配的HTML?谢谢!

2 个答案:

答案 0 :(得分:1)

我通过使用Mechanize ruby​​ gem并设置user_agent解决了我的问题。虽然不一定是我的问题的答案,但我将user_agent设置为搜索机器人,并且使用javascript的页面以不太动态的形式显示。

答案 1 :(得分:0)

watir在这里也可能对你有帮助。