其他想法也欢迎。我正在尝试使用一个excel文件,使用python为javascript html网页生成一个xml,它将基本上显示一个库(或某种目录结构)。 excel文件非常庞大,但让我们假设时间不是那么重要。
到目前为止,我可以将excel电子表格的制表符分隔版本转换为XML,并且我拥有所有链接...现在,我只需要打开浏览器并截取屏幕截图并以正确的方式裁剪它们,或保存网络内容的某些部分,如何....
我正在考虑使用selenium作为网络爬虫,然后使用自动执行键盘命令来保存所有网页,但由于各种原因(这也会非常慢),这不会起作用。
想法?
我看到“智能裁剪”发生的一个例子是在camtasia,他们放大屏幕的某些部分,他们认为焦点将是。我认为这在某种程度上可行。然后,我再也不知道如何以高精度做出这样的假设。