我有这段代码:
count_vect = CountVectorizer()
freq_matrix = count_vect.fit_transform(df.Text).todense()
print freq_matrix
df.text包含推文。按字母顺序创建一包单词,频率矩阵是每条推文中出现的这些单词。
当我在每第37列之后打印矩阵时,会添加一个新行。 像这样 -
[[0 1 1 0 0 0 0 0 1 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
1 0 0 0 0 0 0 0 0 1 0 0 0 1]
[1 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0
1 0 0 0 0 1 0 0 0 1 0 0 1 0]
...
而我认为对于单行,所有列都将在一行中。我怎样才能将它们组合在一起?