我正在编写一个函数将MS Word样式的文本转换为Adobe InDesign格式的文本(它使用一种XML来表示样式)。文本被粘贴到TinyMCE富文本编辑器中,然后将HTML格式的代码发送到php函数。
我已经尝试过此功能,一旦到达我的转换代码就清理代码:
$text = iconv("windows-1250", "UTF-8", $html);
当我使用任何“特殊”字符时,事情就出错了。 £符号,é(或任何其他口音),以及各种“卷曲”撇号/引号似乎打破了事物。例如,如果我尝试转换£
符号,则代码会返回\u0141
,但是当函数返回时,我会在屏幕上显示Ł
符号。
有人知道我能做些什么来阻止Word的奇怪角色打破我正在做的一切吗?
答案 0 :(得分:2)
我好像修好了这个。我使用escape()
来传递值,但用encodeURIComponent()
代替(并删除了我的php代码中的iconv()
调用),这似乎修复了它。