当我使用webread时,它似乎没有下载完整的HTML。 例如,webread('https://www.youtube.com')将下载大部分html。但是让我想要它下载html就像在chrome的开发者工具中看到的那样。有谁知道怎么做?
答案 0 :(得分:0)
如果适合使用外部Java档案,您可以尝试JSoup。
.jar
文件downloaded之后:
% Add to the JAva classpath
javaaddpath('full_path_to_jsoup_jar');
% Connect tot the specified URL
jSoup = org.jsoup.Jsoup.connect('http://youtube.com');
% Get the DOM
document = jSoupDoc.get();
此代码段将返回指定页面的DOM文档。
在获取内容之前,您还可以使用代理 - 如果您有任何内容:
jSoup.proxy('your_proxy', your_proxy_port)