C#从MHT文件中提取HTML

时间:2012-03-06 20:25:08

标签: c# html mhtml

我有一个C#模块,用于从HTML文件中提取信息。但我的输入是一个MHT文件。如何仅提取MHT文件的html部分?

1 个答案:

答案 0 :(得分:1)

我尝试过几种工具&据报道,这些库允许我提取MHT的内容,但几乎都失败了(我发现MHT文件的提供者没有正确编码某些类型)。我最终发现了Total Commander,它让我解压缩MHT并只提取html部分。这是一个黑客,但它完成了工作。

似乎有许多工具可用于创建MHT,而很少有用于解包它们的工具。