MatLab webread没有下载完整的HTML

时间:2016-07-28 21:43:05

标签: matlab

当我使用webread时,它似乎没有下载完整的HTML。 例如,webread('https://www.youtube.com')将下载大部分html。但是让我想要它下载html就像在chrome的开发者工具中看到的那样。有谁知道怎么做?

1 个答案:

答案 0 :(得分:0)

如果适合使用外部Java档案,您可以尝试JSoup

.jar文件downloaded之后:

% Add to the JAva classpath
javaaddpath('full_path_to_jsoup_jar');

% Connect tot the specified URL
jSoup = org.jsoup.Jsoup.connect('http://youtube.com');
% Get the DOM
document = jSoupDoc.get();

此代码段将返回指定页面的DOM文档。

在获取内容之前,您还可以使用代理 - 如果您有任何内容:

jSoup.proxy('your_proxy', your_proxy_port)