马拉雅拉姆语词汇在python中消除歧义

时间:2015-01-28 06:42:06

标签: python

# encoding=utf-8
file=open("mm.txt","r+")
wordcount={}
for word in file.read().split():
    if word not in wordcount:
        wordcount[word] = 1
    else:
        wordcount[word] += 1
print (word,wordcount)
file.close();

这项工作适用于英语句子 如何使用此代码进行马拉雅拉姆语句子

1 个答案:

答案 0 :(得分:0)

打开文件

时,您必须包含编码(utf-8)
import codecs
with codecs.open("mm.txt",encoding="utf-8") as f:
   wordcount={}
     for word in f.read().split():

这将起作用