使用NLTK存储条件频率分布

时间:2012-02-05 16:13:09

标签: python nltk

我正在编写一个使用NLTK的条件频率分布进行文本预测的脚本。

我想将分发存储在SQL数据库中,以便以后使用JSON进行使用。它甚至可能吗?如果是,如何使用JSON转储ConditionalFrequencyDistribution格式?

或许还有一些其他漂亮的存储方式?

cfd = ConditionalFreqDist()
prev_words = None
cnt=0  
for word in words:
    if cnt > 1:
        prev_words = words[cnt-2]+' '+words[cnt-1]
        cfd[prev_words].inc(word)
    cnt+=1

1 个答案:

答案 0 :(得分:1)

您可以使用pickle将ConditionalFreqDist()对象存储在文件

f = open('file.pkl', 'w')
pickle.dump(cfd, f)
f.close()

并取回对象

#load the object
f = open('file.pkl', 'r')
cfd = pickle.load(f)
f.close()