Question

当我使用webread时，它似乎没有下载完整的HTML。例如，webread（'https://www.youtube.com'）将下载大部分html。但是让我想要它下载html就像在chrome的开发者工具中看到的那样。有谁知道怎么做？

Answer 1

如果适合使用外部Java档案，您可以尝试JSoup。

.jar文件downloaded之后：

% Add to the JAva classpath
javaaddpath('full_path_to_jsoup_jar');

% Connect tot the specified URL
jSoup = org.jsoup.Jsoup.connect('http://youtube.com');
% Get the DOM
document = jSoupDoc.get();

此代码段将返回指定页面的DOM文档。

在获取内容之前，您还可以使用代理 - 如果您有任何内容：

jSoup.proxy('your_proxy', your_proxy_port)

MatLab webread没有下载完整的HTML

1 个答案: