大熊猫取代内部运作

时间:2016-03-27 22:15:57

标签: python pandas replace dataframe

我有一个pandas数据帧列车,其中包含24549行中的以下内容

train.iloc[24549,:]
>>> 
id                                                           79571
product_uid                                                 123177
product_title    Charlotte Pipe 3/4 in. PVC Sch. 40 90-Degree S...
search_term                                  3/4 in pvc assesories
relevance                                                     2.67
Name: 24549, dtype: object

我想在train.iloc中将'assesories'替换为'附件'[24549,3]

如果我这样做:

train = train.replace('assessories','accessories')

每当我在此命令后检查df值时,上述数据框元素中的单词仍为“评估”。

但是,如果我这样做:

c =  train.iloc[24549,3]

c = c.replace('assessories','accessories')

c
>>>>  '3/4 in pvc accessories'

我仍然在摸不着头脑。我不想迭代df,而是做一个矢量化实现。你有什么想法怎么做吗?

1 个答案:

答案 0 :(得分:1)

正确的命令不是

train = train.replace('assessories','accessories')

但是

train = train.str.replace('assessories','accessories')

感谢我的朋友Lucas Eustaquio指出这一点。