应用错误收集

如何从网页下载动态生成的内容？

时间：2011-05-01 23:39:22

标签： ruby scripting download html-parsing webpage

我正在尝试从动态生成的网页下载一些数据，因此使用wget不起作用。该页面为http://gaceta.diputados.gob.mx/SIL/Legislaturas/Listados.html我想下载显示的每个选项列表，可以在“Legislatura”字段中选择一旦下载我可以在ruby中处理数据。

只是想知道下载这个的最佳方式是什么，如果可以选择每个选项并下载。

2 个答案:

答案 0 :(得分：1)

您可以使用Safari或Chrome中的Web Inspector或Firefox中的Firebug扩展程序来查看数据的加载方式。该页面正在对此网站的Perl脚本执行AJAX POST请求，并以XML格式返回数据。

我会使用 cURL 来获取数据。

答案 1 :(得分：0)

您可以使用http://watir.com/或webrat来模拟您查看数据的操作，然后使用Nokogiri来解析HTML。

如何下载带有Flash内容的网页
如何从网页下载动态生成的内容？
动态网页内容
从包含动态内容的网页上的表格下载数据
永久链接到动态生成的内容
如何从动态网页获取内容
由动态内容生成的jquery动态内容
如何使用python从网页下载所有可下载内容？
下载网页C＃缺少内容
如何直接从网页上生成javascript生成的内容？

我写了这段代码，但我无法理解我的错误
我无法从一个代码实例的列表中删除 None 值，但我可以在另一个实例中。为什么它适用于一个细分市场而不适用于另一个细分市场？
是否有可能使 loadstring 不可能等于打印？卢阿
java中的random.expovariate()
Appscript 通过会议在 Google 日历中发送电子邮件和创建活动
为什么我的 Onclick 箭头功能在 React 中不起作用？
在此代码中是否有使用“this”的替代方法？
在 SQL Server 和 PostgreSQL 上查询，我如何从第一个表获得第二个表的可视化
每千个数字得到
更新了城市边界 KML 文件的来源？