列表中每个元素之前的不需要的字符

时间:2018-06-04 18:50:41

标签: python nltk text-classification

我为文本分类编写了以下代码,但在印刷品中有一个荒谬的东西。 请检查并告诉我如何解决它。

import nltk
from nltk.corpus import movie_reviews

documents = [(list(movie_reviews.words(fileid)), category)
         for category in movie_reviews.categories()
         for fileid in movie_reviews.fileids(category)]
print documents[1]

打印输出如下。为什么我在每个元素之前收到字母。

$([u'the', u'happy', u'bastard', u"'", u's', u'quick', u'movie', u'review', u'damn', u'that', u'y2k', u'bug', u'.', u'it', u"'", u's', u'got', u'a', u'head', u'start', u'in', u'this', u'movie', u'starring', u'jamie', u'lee', u'curtis', u'and', u'another', u'baldwin', u'brother', u'(', u'william', u'this', u'time', u')', u'in', u'a', u'story', u'regarding', u'a', u'crew', u'of', u'a', u'tugboat', u'that', u'comes', u'across', u'a', u'deserted', u'russian', u'tech', u'ship', u'that', u'has', u'a', u'strangeness', u'to', u'it', u'when', u'they', u'kick', u'the', u'power', u'back', u'on', u'.', u'little', u'do', u'they', u'know', u'the', u'power', u'within', u'.', u'.', u'.', u'going', u'for', u'the', u'gore', u'and', u'bringing', u'on', u'a', u'few', u'action', u'sequences', u'here', u'and', u'there', u',', u'virus', u'still', u'feels', u'very', u'empty', u',', u'like', u'a', u'movie', u'going', u'for', u'all', u'flash', u'and', u'no', u'substance', u'.', u'we', u'don', u"'", u't', u'know', u'why', u'the', u'crew', u'was', u'really', u'out', u'in', u'the', u'middle', u'of', u'nowhere', u',', u'we', u'don', u"'", u't', u'know', u'the', u'origin', u'of', u'what', u'took', u'over', u'the', u'ship', u'(', u'just', u'that', u'a', u'big', u'pink', u'flashy', u'thing', u'hit', u'the', u'mir', u')', u',', u'and', u',', u'of', u'course', u',', u'we', u'don', u"'", u't', u'know', u'why', u'donald', u'sutherland', u'is', u'stumbling', u'around', u'drunkenly', u'throughout', u'.', u'here', u',', u'it', u"'", u's', u'just', u'"', u'hey', u',', u'let', u"'", u's', u'chase', u'these', u'people', u'around', u'with', u'some', u'robots', u'"', u'.', u'the', u'acting', u'is', u'below', u'average', u',', u'even', u'from', u'the', u'likes', u'of', u'curtis', u'.', u'you', u"'", u're', u'more', u'likely', u'to', u'get', u'a', u'kick', u'out', u'of', u'her', u'work', u'in', u'halloween', u'h20', u'.', u'sutherland', u'is', u'wasted', u'and', u'baldwin', u',', u'well', u',', u'he', u"'", u's', u'acting', u'like', u'a', u'baldwin', u',', u'of', u'course', u'.', u'the', u'real', u'star', u'here', u'are', u'stan', u'winston', u"'", u's', u'robot', u'design', u',', u'some', u'schnazzy', u'cgi', u',', u'and', u'the', u'occasional', u'good', u'gore', u'shot', u',', u'like', u'picking', u'into', u'someone', u"'", u's', u'brain', u'.', u'so', u',', u'if', u'robots', u'and', u'body', u'parts', u'really', u'turn', u'you', u'on', u',', u'here', u"'", u's', u'your', u'movie', u'.', u'otherwise', u',', u'it', u"'", u's', u'pretty', u'much', u'a', u'sunken', u'ship', u'of', u'a', u'movie', u'.'], u'neg')

0 个答案:

没有答案