通过MATLAB阅读网站内容

时间:2012-04-19 16:45:34

标签: java matlab

我需要通过MATLAB阅读网站的内容,但问题是当我加载网站时:

URL = java.net.URL(UrlNew);
urlConnection = URL.openConnection();
urlConnection.connect();
str = regexprep(fileread(filename),'\s*',' ');

网站将我重定向到一个页面,我首先按“我同意”按钮,然后进入请求的页面。

如何在MATLAB中处理这种情况。我需要以某种方式点击MATLAB中的“同意”按钮才能访问原始网页。

THX

1 个答案:

答案 0 :(得分:1)

首先,您需要在原始页面上找到表单的action属性的值。您可以通过检查页面的源代码,查找包含“同意”按钮的表单标记,或手动单击按钮并查看Chrome开发者工具或Firefox中的Firebug中的“网络活动”选项卡来执行此操作。

找到后,了解如何使用Java发送POST请求,并通过向表单的操作URL发送POST请求来模拟单击按钮。如果在此之后从套接字收集输出,它应该对应于您想要的页面。