我想将Office 2007文档(docx)中的文本复制并粘贴到textarea中。在Window上,使用Firefox 3,还有其他的jiberish可以进入现场:
...Normal 0 false false false EN-US X-NONE X-NONE MicrosoftInternetExplorer4 Normal
0 false false false EN-US X-NONE X-NONE MicrosoftInternetExplorer4 Normal 0 false
false false EN-US X-NONE X-NONE MicrosoftInternetExplorer4 <!--[if gte mso 9]>...
似乎是较新文档结构中的样式信息和条件注释。关于如何解析这个或阻止这种情况发生的任何想法?可能性是正面的Javascript,或背面的Java。
答案 0 :(得分:1)
与林肯的想法类似,您可以使用PureText来自动完成此过程。基本上,你按热键而不是Ctrl + V(我已经设置为Win + V),它会粘贴剪贴板上任何内容的纯文本版本。我不确定这是否会删除Office添加的额外数据,但值得一试。
答案 1 :(得分:-1)
我发现消除这种随机乱码的最简单方法是复制你想要的文本,将其粘贴到记事本或类似的明文编辑器中,从记事本中复制,然后将其粘贴到字段中。
此外,通过删除“智能”引号和em / en破折号的脚本或应用程序运行它也不是一个坏主意。
答案 2 :(得分:-1)
有第三方工具可以消除错误的“微软令人毛骨悚然”的东西。你甚至可以在服务器上注册一些并在你自己的代码中使用它们(“清理任何人的废话”按钮?)