nps_chat语料库中的问题训练unigram tagger

时间:2011-09-05 23:12:36

标签: nlp nltk

起初我尝试在标记句子上训练标记器,但与之不同 布朗,nps聊天语料库似乎没有采用tagged_sents()方法。 所以我尝试了标记单词的训练,Python返回错误 消息:

> Traceback (most recent call last):    File "<pyshell#55>", line 1, in
> <module> 
>     unigram_tagger = nltk.UnigramTagger(training_set)    File
> "C:\Python26\lib\site-packages\nltk\tag\sequential.py", line 287, in 
> __init__ 
>     backoff, cutoff, verbose)    File
> "C:\Python26\lib\site-packages\nltk\tag\sequential.py", line 270, in 
> __init__ 
>     self._train(train, cutoff, verbose)    File
> "C:\Python26\lib\site-packages\nltk\tag\sequential.py", line 181, in 
> _train 
>     tokens, tags = zip(*sentence)  ValueError: need more than 1 value
> to unpack

我怀疑这个问题与我正在尝试的事实有关 在标记的单词而不是句子上训练标记符,但是它是什么 解决这个问题,如果nps聊天不采用tagged_sents方法?为什么呢 它不接受这种方法吗?请指教。

0 个答案:

没有答案