在AJAX请求中编码Microsoft Word字符的问题

时间:2010-03-22 10:49:46

标签: ajax encoding ms-word

我正在编写一个函数将MS Word样式的文本转换为Adobe InDesign格式的文本(它使用一种XML来表示样式)。文本被粘贴到TinyMCE富文本编辑器中,然后将HTML格式的代码发送到php函数。

我已经尝试过此功能,一旦到达我的转换代码就清理代码:

$text = iconv("windows-1250", "UTF-8", $html);

当我使用任何“特殊”字符时,事情就出错了。 £符号,é(或任何其他口音),以及各种“卷曲”撇号/引号似乎打破了事物。例如,如果我尝试转换£符号,则代码会返回\u0141,但是当函数返回时,我会在屏幕上显示Ł符号。

有人知道我能做些什么来阻止Word的奇怪角色打破我正在做的一切吗?

1 个答案:

答案 0 :(得分:2)

我好像修好了这个。我使用escape()来传递值,但用encodeURIComponent()代替(并删除了我的php代码中的iconv()调用),这似乎修复了它。