将包含反斜杠的富文本转换为纯文本或html

时间:2010-05-15 13:43:55

标签: rtf backslash

我正在尝试将富文本字符串转换为纯文本或html。我目前正在使用RichTextBox.Text功能,它几乎适用于所有情况,除非文本包含反斜杠,然后一些文本被删除,因为转换器认为它是rtf格式的一部分。有没有人知道如何让反斜杠留在那个实例中。 这是我将拥有的字符串的示例

{\rtf1\ansi\ansicpg1252\deff0\deflang1033{\fonttbl{\f0\fnil\fcharset0 Arial;}}\viewkind4\uc1\pard\fs17 Testing Export \with comments\par}

我需要的文本是“使用注释测试导出\”,我从rtf转换器返回的文本是“测试导出注释”。任何帮助将不胜感激。如果您有其他问题,请回复。

1 个答案:

答案 0 :(得分:0)

我认为转换器是正确的。 RTF中的文本中的实际反斜杠应该被转义(例如,到\\)。我相信,你所得到的RTF根本不是有效的。

惠斯特你可以尝试通过对输入进行正则表达式替换以加倍任何不属于valid control words的反斜杠来修复它,这看起来非常脆弱,如果有人添加序列会出错 有效控制字的文本。安全的唯一方法是修复生成RTF的任何东西以正确地逃避反斜杠。