我正在寻找一种方法来准确检测SRT字幕文件的字符编码,用于给定的(用户选择的)语言。我目前正在使用jschardet库进行检测,不幸的是经常会出错。
var fs = require("fs");
var jschardet = require("jschardet");
var iconv = require('iconv-lite');
var loadFile = function(path, langCode){
var content = fs.readFileSync(path);
var encoding = jschardet.detect(content).encoding.toLowerCase();
return iconv.decode(content, encoding);
};
(这是为了防止我的代码出现问题)
有没有比jschardet更准确的东西?也许某些东西也接受语言作为论证?我想这些信息可以提高很多准确性,但我不熟悉任何以语言为参数的图书馆。