Python pandas在删除停用词时出错

时间:2017-12-12 05:53:04

标签: python pandas

使用以下代码,我得到的数据类型不明白错误。非常感谢。

train["item_description"] = train["item_description"].str.lower().str.split()
train['item_description'].apply(lambda x: [item for item in x if item not in stop])
train["item_description"] = train["item_description"].astype(str)    
print(train["item_description"][:10])`

1 个答案:

答案 0 :(得分:0)

输入数据中的数据类型似乎存在一些问题。在对数据执行任何操作之前,请确保将所有内容显式转换为字符串。你可以在一行上完成所有事情:

train['item_description'] = train['item_description'].apply(lambda x: [item for item in str(x).lower().split() if item not in stop])