在Node.js中自动检测字符编码

时间:2015-07-08 01:18:23

标签: javascript node.js utf-8 character-encoding iconv

我正在寻找一种方法来准确检测SRT字幕文件的字符编码,用于给定的(用户选择的)语言。我目前正在使用jschardet库进行检测,不幸的是经常会出错。

var fs = require("fs");
var jschardet = require("jschardet");
var iconv = require('iconv-lite');

var loadFile = function(path, langCode){
    var content = fs.readFileSync(path);
    var encoding = jschardet.detect(content).encoding.toLowerCase();
    return iconv.decode(content, encoding);
};

(这是为了防止我的代码出现问题)

有没有比jschardet更准确的东西?也许某些东西也接受语言作为论证?我想这些信息可以提高很多准确性,但我不熟悉任何以语言为参数的图书馆。

0 个答案:

没有答案