应用错误收集

我是nltk的新人。我尝试使用nltk.pos_tag来标记这样的字词：[[（＆＃39; This＆＃39;，＆＃39; DT＆＃39;），（＆＃39;是＆＃39;，＆＃39; VBZ＆＃39;），（＆＃39; a＆＃39;，＆＃39; DT＆＃39;），（＆＃39; text＆＃39;，＆＃39; NN＆＃39;），（＆＃39; for＆＃39;，＆＃39; IN＆＃39;），（＆＃39; test＆＃39;，＆＃39; NN＆＃39;），（＆＃39;。＆＃39;，＆＃39; 。＆＃39;），[（＆＃39;和＆＃39;，＆＃39; CC＆＃39;），（＆＃39;我＆＃39;，＆＃39; PRP＆＃39;），（＆＃39;想要＆＃39;，＆＃39; VBP＆＃39;），（＆＃39;到＆＃39;，＆＃39; TO＆＃39;），（＆＃39; learn＆＃39;，＆＃39; VB＆＃39;），（＆＃39;如何＆＃39;＆＃39; WRB＆＃39;），（＆＃39; to＆＃39;，＆＃39; TO＆＃39;），（＆＃39;使用＆＃39;，＆＃39; VB＆＃39;），（＆＃39; nltk＆＃39;，＆＃39; NN＆＃39;），（＆＃39;。＆＃39;，＆＃39;＆＃39）]] 我按照指示操作，发现很多人都得到了正确的结果。我的代码如下：句子=＆＃34;为什么TCP比UDP更可靠＆＃34; 词语= nltk.word_tokenize（句子）打印（字）标签= [] 对于范围内的i（0，len（单词））： tags.append（nltk.pos_tag（字[I]））印刷（标签）但是，我的结果是：

[＆＃39;为什么＆＃39;，＆＃39; TCP＆＃39;，＆＃39;是＆＃39;，＆＃39;更多＆＃39;，＆＃39;可靠＆＃39;，＆＃39;比＆＃39;，＆＃39; UDP＆＃39;] [[（＆＃39; W＆＃39;，＆＃39; NNP＆＃39;），（＆＃39; h＆＃39;，＆＃39; NN＆＃39;），（＆＃39; y＆＃39; ;，＆＃39; NN＆＃39;]，[（＆＃39; T＆＃39;，＆＃39; NNP＆＃39;），（＆＃39; C＆＃39;，＆＃39; NNP＆＃ 39）.....

我真的希望有些天才可以帮助我。

为什么我的nltk.pos_tag标记字母而不是单词

0 个答案: