使用JavaScript读取/写入文件时的字符编码

时间:2013-09-17 01:31:23

标签: javascript php utf-8 character-encoding ansi

我目前在客户端JavaScript中遇到了一些字符编码问题。我的基本程序流程如下:客户端JavaScript使用漂亮的FileReader读取本地文本文件。然后我对字符串进行了一系列编辑,然后我尝试为用户提供一种下载新的,更改过的文件的方法。这是我的问题,我正在阅读的文件(根据Notepad ++)以ANSI编码,我想写的文件也需要用ANSI编码。

当我尝试从这样的文件中读取时:

reader.readAsText(this.files[0], "ANSI");
...
cachedFile = e.target.result.split("\n");
console.log(cachedFile[179544]);

我的结果是这样的(Î字符未正确读取):

name="�le-de-France" 

但是,当我使用ISO-8859-1作为编码参数(完全随机选择)时,由于某种原因,结果是正确的:

name="Île-de-France" 

所以很有可能我不知道发生了什么。所以我给它留下了ISO-8859-1编码,进行了各种编辑,然后尝试准备下载。我不能简单地将其发送到我的服务器解压缩并准备下载文件,因为坦率地说这个文件相当大(~14 mb)。然而它确实非常好地压缩,因为它是纯文本。问题是我发现的任何JavaScript压缩库(比如jszip很好地让你生成一个文件并将其粘贴在.zip中)似乎保持了JavaScript的内部字符串编码,我相信它是UTF-16。 .zip文件也编码为base64(我刚刚在我的PHP服务器上解码)。当然,这样做会给出类似这样的结果:

name="ÃŽle-de-France"

所以这是我的问题,我有一个用ANSI编码的文件,我使用ISO-8859-1解析它,我用UTF-16编辑它,我需要找到一种方法将它恢复到ANSI和一个人的桌面。有没有一种标准方法可以在压缩之前将JavaScript字符串转换为ANSI,这样我就可以将压缩文件提供给我的用户下载?或者有没有办法使用PHP解压缩服务器端的字符串,转换为ANSI,然后提供下载?仅供参考,我目前的PHP代码就是这样:

<?php 

 $res = $_POST["saveString"];
 $maybe = base64_decode($res);
 header('Content-Type: application/download');
 header('Content-Disposition: attachment; filename="genSave.zip"');
 header("Content-Length: " . strlen($maybe));
 echo $maybe;

?>

2 个答案:

答案 0 :(得分:3)

我的猜测是[如果不正确,我将删除答案]您的编码值无效。记事本称为“ANSI”的是Windows-1252,几乎与ISO-8859-1相同。您期望“ANSI”不是ISO-8859-1?这应该有效:

reader.readAsText(this.files[0], "iso-8859-1");
reader.readAsText(this.files[0], "windows-1252");

请参阅the W3C spec以供参考。

答案 1 :(得分:0)

我最终得到了一个稍微迂回的解决方案,可能没有那么高效。我使用JavaScript将一个包含1200万字符的UTF-16编码字符串放入.zip文件中,将其发布到我在base64中编码的服务器,将其转换回字符串,将其放入临时文件,打开该临时文件作为。 zip文件,解压缩后,将其转换为ISO-8859-1,重新打包,然后将其下载到客户端。

最终的服务器端代码非常简单,但不幸的是很慢:

<?php 

   $res = $_POST["saveString"];
   $zipInMem = base64_decode($res);

   $file = tempnam("tmp", "zip"); 
   file_put_contents ($file, $zipInMem);

   $zip = zip_open($file);

   $zip_entry = zip_read($zip);

   zip_entry_open($zip, $zip_entry);

   $contents = utf8_decode(zip_entry_read($zip_entry, zip_entry_filesize($zip_entry)));

   $zip = new ZipArchive();
   $zip->open($file, ZipArchive::OVERWRITE);

   $zip->addFromString('genFile.eu4', $contents);
   $zip->close();

   header('Content-Type: application/zip');
   header('Content-Disposition: attachment; filename="genSave.zip"');
   header("Content-Length: " . filesize($file));

   readfile($file);

   unlink($file);

?>