我们运行一些大型目录,用户经常将word文档中的内容复制/粘贴到我们的TinyMCE html编辑器中。
这个问题通常是以下文本隐藏在那里,显示在我们的网页上:
<!-- /* Style Definitions */ p.MsoNormal, li.MsoNormal, div.MsoNormal {mso-style-parent:""; margin:0in; margin-bottom:.0001pt; mso-pagination:widow-orphan; mso-layout-grid-align:none; punctuation-wrap:simple; text-autospace:none; font-size:10.0pt; font-family:"Times New Roman"; mso-fareast-font-family:"Times New Roman";} a:link, span.MsoHyperlink {color:blue; text-decoration:underline; text-underline:single;} a:visited, span.MsoHyperlinkFollowed {color:purple; text-decoration:underline; text-underline:single;} p {mso-margin-top-alt:auto; margin-right:0in; mso-margin-bottom-alt:auto; margin-left:0in; mso-pagination:widow-orphan; font-size:12.0pt; font-family:"Times New Roman"; mso-fareast-font-family:"Times New Roman";} @page Section1 {size:8.5in 11.0in; margin:1.0in 1.25in 1.0in 1.25in; mso-header-margin:.5in; mso-footer-margin:.5in; mso-paper-source:0;} div.Section1 {page:Section1;} -->
是否有TinyMCE插件或其他一些跨浏览器的html编辑器会自动删除它?
或者另一种解决方案是使用某些php regex命令或者可以删除这些注释声明的内容。
答案 0 :(得分:3)
我多年来一直在努力优化那个。
到目前为止,我的最佳解决方案是:
<p>
和<br />
之间的区别,因此将所有内容视为一个简单的中断,因为它不那么混乱,而且更像ms-word 这将是初始化代码。
remove_linebreaks : false,
force_br_newlines : true, <?php /* maybe we can behave more like gmail */ ?>
force_p_newlines : false, <?php /* and preserve all message line breaks */ ?>
convert_newlines_to_brs : false, <?php /* even so i would not count with it */ ?>
forced_root_block : false
<?php /* explicitly define what will be allowed */ ?>
valid_elements: "h1,h2,h3,br,b,a,i,u,strong/b,em/i,u/span,strike/span,span,span[style],"+
"sub,sup,a[href|name|anchor|target|title],ul,ol,li,p,object[classid|width|height|codebase|*],"+
"param[name|value|_value],embed[type|width|height|src|*],"+
"img[style|longdesc|usemap|src|border|alt=|title|hspace|vspace|width|height|align]",
然后我有以下后处理功能删除所有<p>
并将所有</p>
转换为<br /><br />
这是最强稳定副本 - 粘贴解决方案我已经能够开发。
这是后处理功能:
setup : function(ed) {
ed.onPostProcess.add(function(ed, o) {
// Remove all paragraphs and replace with BR
o.content = o.content.replace(/<p [^>]+>|<p>/g, '');
o.content = o.content.replace(/<\/p>/g, '<br />');
});
},
请注意,所有这些只是Javascript过滤,用户将能够快速将所有不需要的代码传递给服务器。即使此设置可能用于最终管理员设置,也可以在服务器端使用strip_tags
,因为某个人可能会绕过它。
希望它有所帮助!
答案 1 :(得分:1)
我正在使用PHP regex命令。
$str = preg_replace('/<!--.*?--\>/','',$str);