我正在编写一个代码,需要将任何类型的文档从客户端的机器上传到服务器,并从中提取图像。对于几乎所有文档,Tika都很有帮助,但是对于html页面,图像被引用到本地机器的路径。那么如何上传html页面及其包含的图像呢? 我使用Java Servlets和JSP作为平台。
答案 0 :(得分:1)
这不可能解决服务器端,你必须实现客户端(Javascript?Java applet?Flash(yuck!)?)解决方案。 HTML文档只是一个文本,它不包含图像 - 它只是引用它们。因此,您必须解析文档,获取图像,单独上传它们,然后 - 服务器端 - 处理文档并调整图像引用(src
属性的值)。
非常复杂,不是吗?