标签: java html mhtml
我收到了mht文件。我需要从这个文件中提取文本并继续使用一些商业逻辑。
有没有办法从mht文件中提取文本?
有没有办法将MHT转换成html?
答案 0 :(得分:0)
由于MHTML基本上是包含原始HTML文件及其所有资源的MIME文档,因此您可以使用MIME库来提取不同的部分。请注意,mht文件中html文件中的所有引用都可能引用嵌入文件的原始位置,您需要从MIME部分的Content-Location标头重建这些引用。