我从Octave脚本下载网页并将其与urlwrite一起存储。问题是网页不是可读的HTML",而是一组在浏览器上构建(文本)页面的脚本。当然,urlread会产生相同的结果。
如何阅读我在浏览器中看到的实际网页?不知道从Octave运行JS的任何方法。
答案 0 :(得分:0)
问题在Linux下使用xdotool
解决了。 “系统”调用将打开一个带有要下载的网页的chrome窗口,然后'xdotool'将关注该窗口,发送Ctrl-U以打开源(这是真实内容),发送Ctrl-A和Ctrl- C复制所有内容,然后粘贴xsel
并保存html文件。这意味着手动过程的自动化,并且它运作良好。无法找到“干净”的解决方案。
这是符合此格式的页面的example。