我正在尝试解析HTML电子邮件,将其内容存储为可理解的原始文本。
HtmlAgilityPack看起来很受欢迎,但让我完成大部分的解析/解释,我们说的是看起来很混乱的HTML。
另一方面,如果我在IE / Firefox / Chrome中加载示例HTML电子邮件,他们都会获得正确的解析,并且简单的复制/粘贴可以获得我想要的文本。
似乎有一些方法可以使用Windows.Forms.WebBrowser从C#进入Trident,但我的项目基于命令行,这将是一种相当糟糕的做事方式。
所以我的问题,简而言之:是否有一种非图形方式可以使用Trident / Gecko / Chrome将HTML解析为文本?