如何理解utf8编码文本中的文本语言?

时间:2015-06-06 11:11:57

标签: node.js utf-8 character-encoding redis language-detection

Redis正在使用utf8代码,对于我的项目,我需要获得utf8编码文本的文本语言。

有什么方法可以提供关于文本语言的线索吗?

编辑:我的项目是NodeJs编程语言。在Redis中,也许lua脚本有办法处理这个问题但是在nodejs中是否有任何包可以理解从Redis中检索到的文本?

2 个答案:

答案 0 :(得分:1)

谷歌搜索"语言检测节点"。这出现了https://github.com/FGRibreau/node-language-detecthttps://github.com/dachev/node-cld

答案 1 :(得分:0)

语言检测不是Redis特定的任务。我不知道您使用的是哪种语言,但在Ruby中,您可以使用whatlanguage gem来检测语言。我认为其他语言也有类似的库。