Question

起初我尝试在标记句子上训练标记器，但与之不同布朗，nps聊天语料库似乎没有采用tagged_sents（）方法。所以我尝试了标记单词的训练，Python返回错误消息：

> Traceback (most recent call last):    File "<pyshell#55>", line 1, in
> <module> 
>     unigram_tagger = nltk.UnigramTagger(training_set)    File
> "C:\Python26\lib\site-packages\nltk\tag\sequential.py", line 287, in 
> __init__ 
>     backoff, cutoff, verbose)    File
> "C:\Python26\lib\site-packages\nltk\tag\sequential.py", line 270, in 
> __init__ 
>     self._train(train, cutoff, verbose)    File
> "C:\Python26\lib\site-packages\nltk\tag\sequential.py", line 181, in 
> _train 
>     tokens, tags = zip(*sentence)  ValueError: need more than 1 value
> to unpack

我怀疑这个问题与我正在尝试的事实有关在标记的单词而不是句子上训练标记符，但是它是什么解决这个问题，如果nps聊天不采用tagged_sents方法？为什么呢它不接受这种方法吗？请指教。

nps_chat语料库中的问题训练unigram tagger

0 个答案: