使用php解码来自.rtf或.doc的特殊字符

时间:2012-10-08 22:06:54

标签: special-characters decoding iso-8859-1 latin1

我试图找到一种干净的方法来解码一些使用php的“特殊字符”,我有一个RTF文件(aslo PDF和DOC与理智的问题),我设法打开它并在其中找到明文,最后它仍然输出一些字符,如:é为é或ç为ç。 我尝试了mb_detect_encoding(也是“auto”)但它检测到“ACSII”,我尝试使用mb_convert_encoding($ mytext,'ISO-8859-1'),mb_convert_encoding($ mytext,'ISO-8859-15'进行转换) mb_convert_encoding($ mytext,'UTF-8'),然后是UTF-8到ISO-8859-1,htmlspecialchars,utf8_decode(递归)。 我制作了一个映射表,但我不认为这是最好的方法吗?

Xavier VILAIN

PS:大部分文件都是在法国拉丁字符集中创建的。

0 个答案:

没有答案