从Outlook / Word / Office粘贴到嵌入式浏览器

时间:2011-05-17 16:55:50

标签: html ms-office

所以,我们有一个很棒的应用程序,这很顺利,但我们的一些用户喜欢在粘贴到我们的应用程序之前将文本复制到文字。当他们这样做时,HTML被解析得有些正确,但通常包含来自outlook或word的标签,我们的XHTML引擎不喜欢或理解。

例如,用户在Word中键入一个注释,其中包含一些次要格式,并且它们会进入我们的HTML编辑器(它只是打开了设计模式的基本Web浏览器),后续源包括< _o3a_p>标签,等等。

我是否只需为每种类型的MSO html标签编写一个剥离器?

3 个答案:

答案 0 :(得分:2)

我很幸运将WORD内容粘贴到Libre Office,然后重新选择并将文本从Libre Office复制到Web表单中。

它保留格式和链接,并删除所有Microsoft格式代码。

答案 1 :(得分:1)

一致认为,尽管一些可用的工具在自动解析ms工作标签方面有些成功,但没有一个是100%完美的。解析这些标记的方法取决于您使用的框架。

正则表达式可能是一个干净的修复。

可以找到有关此主题的更多信息

on this blog post that basically documents the same struggle you seem to be having.

答案 2 :(得分:1)

作为有时将数据从Word复制到Web表单的用户(我有时想首先拼写检查),我通过首先粘贴到记事本,然后从那里复制并粘贴到Web表单中找到了很大的成功。

然而,Word仍有时笑到最后。如果您启用了“智能引号”,则会转为

This is the "best" way.

This is the “best” way.

(请注意“最佳”一词的引号。)

解决这个问题的简单方法是在我开始输入之前关闭智能引号;我也可以使用记事本查找所有“智能引号”符号(“”“)并用”普通引号“符号(”“”)替换它们。