我正在编写一个使用NLTK的条件频率分布进行文本预测的脚本。
我想将分发存储在SQL数据库中,以便以后使用JSON进行使用。它甚至可能吗?如果是,如何使用JSON转储ConditionalFrequencyDistribution格式?
或许还有一些其他漂亮的存储方式?
cfd = ConditionalFreqDist()
prev_words = None
cnt=0
for word in words:
if cnt > 1:
prev_words = words[cnt-2]+' '+words[cnt-1]
cfd[prev_words].inc(word)
cnt+=1
答案 0 :(得分:1)
您可以使用pickle将ConditionalFreqDist()对象存储在文件
中f = open('file.pkl', 'w')
pickle.dump(cfd, f)
f.close()
并取回对象
#load the object
f = open('file.pkl', 'r')
cfd = pickle.load(f)
f.close()