如何获取json文件的字符编码类型?

时间:2017-01-18 02:48:03

标签: c++ unicode utf-8 ansi jsoncpp

我想从jsoncpp获取json字符串的字符编码类型:UTF-8,ANSI或UNICODE?如何获取json :: value的字符编码类型?谢谢你!

2 个答案:

答案 0 :(得分:0)

任何字符串只是一个字节序列,符合,可能是某些基本规则(空终止符,json的禁止符号等)。没有神奇的方法来确定使用哪种编码来形成字符串,因为编码只是表示字符串二进制数据的一种方式。所以json字符串编码应该由json发布者指定(可能在文档中),或者有关它的信息应该是json的一部分(如果由于某种原因,不同的字符串具有不同的编码)。

答案 1 :(得分:0)

确定字符串的字符编码非常复杂。请参阅this SO answer以选择正确的应用程序。

根据以下引用,

Apache Tika - the content analysis toolkit可能是最先进的之一:

  

Apache Tika™工具包可检测并提取超过一千种不同文件类型(如PPT,XLS和PDF)的元数据和文本。所有这些文件类型都可以通过单一界面进行解析,使得Tika对搜索引擎索引,内容分析,翻译等非常有用。您可以在下载页面上找到最新版本。

可以使用这些库中的每个库来分析JSON字符串,从而使(可能的)CharSet可用于进一步处理。