从RTF解析格式化文本

时间:2013-06-30 04:03:14

标签: c# .net rtf

我正在尝试从RTF文件中解析粗体文本行。现在,我正在通过使用Regex并在文件中查找“\ b ... \ b0”标签来实现它,但这会留下大量格式化文本,并且RTF中有太多格式化标签我不能只是硬编码,并称之为一天。是否有更优雅的现有解决方案仅解析具有特定格式的行?

3 个答案:

答案 0 :(得分:0)

我会使用RTF解析器... RichTextBox。有几种方法可以使用RTB获取格式。

答案 1 :(得分:0)

没有。我最近处理了一个项目,我们必须在其中获取RTF文档,包括嵌入式媒体,并将其转换为MIME多部分消息。我们构建了几组RegEx来拆分文档的各个部分,然后将每个格式化选项转换为适当的HTML / CSS标记。真的没有“优雅”的方式去做你想做的事。

你想用RTF做什么?我们的最终目标是对所提供的RTF进行HTML转换。我知道在WPF世界中,RichTextBox能够保存为多种格式,例如XAML,这可能不需要自己处理解析。

此外,市场上还有RTF转换器,所以有了更多的背景,我可以提出更好的建议。

答案 2 :(得分:0)

你应该看看RtfDomParser。 我发现了一些解析器无法工作的情况,但全局也没问题。