我有一个名为final的数据框,其中有一个名为CleanedText的列,其中有用户评论(文本)。评论是多行的。我已经完成了预处理,并删除了所有逗号,句号,htmltags等。因此,数据看起来像是Review1(row1):比萨饼非常晚才可口。就是这样,我有10000条评论(对应10000行)。现在,我想要一个列表列表,其中每个评论都应在列表中。例如:[['Pizza','extremely','delicious','delivery','late'],['Tommatos','rotten'... [] ... []]。>
答案 0 :(得分:1)
这假设您已经真正剥离了所有“有趣”内容的文本。试一试。
fulltext = 'stuff with many\nlines and words'
text_array = [line.split() for line in fulltext.splitlines()]