我正在尝试绘制我的单词袋,以选择合适数量的单词来训练我的回归算法。但是,当我尝试绘制它时,会出现错误。
这是我用来制作单词袋的代码:
df['BOW'] = df.Review2.str.split().apply(Counter)
df['BOW'].head()
这是绘制代码(我使用seaborn
):
sns.distplot(df['BOW'].sum())
这是错误:
TypeError:/:“ Counter”和“ int”的不受支持的操作数类型
这是我的一堆单词的样子:
0 {'good':2,'need':1,'change':1,'virgils':...
1 {'new':3,'favorite':2,2,'give':1,'delightf ...
2 {'red':3,'sauce':2,'favorite':1,'enjoy':...
3 {'quality':1,'fantastic':1,'1800s':1,'21 ...
4 {'red':1,'first':1,'time':1,'try':1,'l ...
任何见识都受到赞赏!
答案 0 :(得分:2)
您正在生成2018-06-12
个对象。
Counter
虽然您可以>>> Counter('some words here are some repeated words'.split())
Counter({'words': 2, 'repeated': 1, 'some': 2, 'here': 1, 'are': 1})
对抗对象,但是...
sum()
...您无法将它们除以计算平均值:
>>> Counter('aaabb') + Counter('abc')
Counter({'a': 4, 'b': 3, 'c': 1})
您的绘图库似乎正在执行此操作?也许您想从图形中删除该列。...