应用错误收集

其他想法也欢迎。我正在尝试使用一个excel文件，使用python为javascript html网页生成一个xml，它将基本上显示一个库（或某种目录结构）。 excel文件非常庞大，但让我们假设时间不是那么重要。

到目前为止，我可以将excel电子表格的制表符分隔版本转换为XML，并且我拥有所有链接...现在，我只需要打开浏览器并截取屏幕截图并以正确的方式裁剪它们，或保存网络内容的某些部分，如何....

我正在考虑使用selenium作为网络爬虫，然后使用自动执行键盘命令来保存所有网页，但由于各种原因（这也会非常慢），这不会起作用。

想法？

我看到“智能裁剪”发生的一个例子是在camtasia，他们放大屏幕的某些部分，他们认为焦点将是。我认为这在某种程度上可行。然后，我再也不知道如何以高精度做出这样的假设。