为什么我的nltk.pos_tag标记字母而不是单词

时间:2018-04-24 13:48:21

标签: python nlp nltk

我是nltk的新人。我尝试使用nltk.pos_tag来标记这样的字词:[[(' This',' DT'),('是',' VBZ& #39;),(' a',' DT'),(' text',' NN'),(' for',' IN'),(' test',' NN'),('。',' 。'),[('和',' CC'),('我',' PRP'),( '想要',' VBP'),('到',' TO'),(' learn',& #39; VB'),('如何'' WRB'),(' to',' TO'),( '使用',' VB'),(' nltk',' NN'),('。', '&#39)]] 我按照指示操​​作,发现很多人都得到了正确的结果。我的代码如下:     句子="为什么TCP比UDP更可靠"     词语= nltk.word_tokenize(句子)     打印(字)     标签= []     对于范围内的i(0,len(单词)):         tags.append(nltk.pos_tag(字[I]))     印刷(标签) 但是,我的结果是:

['为什么',' TCP','是','更多','可靠',& #39;比',' UDP'] [[(' W',' NNP'),(' h',' NN'),(' y' ;,' NN'],[(' T',' NNP'),(' C',' NNP&# 39).....

我真的希望有些天才可以帮助我。

0 个答案:

没有答案