我是Python新手,我尝试编码UTF8字符串。使用PHP json_encode()
,…
(U + 2026)变为\u2026
。但是,使用Python json.dumps()
,它变为\u00e2\u20ac\u00a6
。如何在Python中将其转换为\u2026
?
这是整个计划:
import nltk
import json
file=open('pos_tag.txt','r')
tags=nltk.pos_tag(nltk.word_tokenize(file.read()))
print(json.dumps(tags,separators=(',',':')))
答案 0 :(得分:0)
问题在于file.open()
。我能够使用编解码器模块修复它:
import nltk
import json
import codecs
file=codecs.open('pos_tag.txt','r','utf-8')
tags=nltk.pos_tag(nltk.word_tokenize(file.read()))
print(json.dumps(tags,separators=(',',':')))