使json.dumps在Python中正确输出unicode字符

时间:2015-07-09 02:01:19

标签: python unicode python-unicode

我是Python新手,我尝试编码UTF8字符串。使用PHP json_encode()(U + 2026)变为\u2026。但是,使用Python json.dumps(),它变为\u00e2\u20ac\u00a6。如何在Python中将其转换为\u2026

这是整个计划:

import nltk
import json

file=open('pos_tag.txt','r')
tags=nltk.pos_tag(nltk.word_tokenize(file.read()))

print(json.dumps(tags,separators=(',',':')))

1 个答案:

答案 0 :(得分:0)

问题在于file.open()。我能够使用编解码器模块修复它:

import nltk
import json
import codecs

file=codecs.open('pos_tag.txt','r','utf-8')
tags=nltk.pos_tag(nltk.word_tokenize(file.read()))

print(json.dumps(tags,separators=(',',':')))