我试图从包含RTF
格式的字符串中获取纯文本
例如,我有:
originalText = {\rtf1\ansi\ansicpg1252\deff0\deflang1033{\fonttbl{\f0\fnil\fcharset0 Tahoma;}} \viewkind4\uc1\pard\f0\fs20 the temp is forty degrees\par}
我希望获得:
plainText = the temp is forty degrees
我在线找到了以下 Regex :({\)(.+?)(})|(\)(.+?)()
所以我尝试了这个,但它只是给了我原来的表达:
pattern = "({\\)(.+?)(})|(\\)(.+?)(\b)";
plainText = originalText.replace(pattern,"123");