Question

我有一个pandas数据帧列车，其中包含24549行中的以下内容

train.iloc[24549,:]
>>> 
id                                                           79571
product_uid                                                 123177
product_title    Charlotte Pipe 3/4 in. PVC Sch. 40 90-Degree S...
search_term                                  3/4 in pvc assesories
relevance                                                     2.67
Name: 24549, dtype: object

我想在train.iloc中将'assesories'替换为'附件'[24549,3]

如果我这样做：

train = train.replace('assessories','accessories')

每当我在此命令后检查df值时，上述数据框元素中的单词仍为“评估”。

但是，如果我这样做：

c =  train.iloc[24549,3]

c = c.replace('assessories','accessories')

c
>>>>  '3/4 in pvc accessories'

我仍然在摸不着头脑。我不想迭代df，而是做一个矢量化实现。你有什么想法怎么做吗？

Answer 1

正确的命令不是

train = train.replace('assessories','accessories')

但是

train = train.str.replace('assessories','accessories')

感谢我的朋友Lucas Eustaquio指出这一点。

大熊猫取代内部运作

1 个答案: