我有一个pandas数据帧列车,其中包含24549行中的以下内容
train.iloc[24549,:]
>>>
id 79571
product_uid 123177
product_title Charlotte Pipe 3/4 in. PVC Sch. 40 90-Degree S...
search_term 3/4 in pvc assesories
relevance 2.67
Name: 24549, dtype: object
我想在train.iloc中将'assesories'替换为'附件'[24549,3]
如果我这样做:
train = train.replace('assessories','accessories')
每当我在此命令后检查df值时,上述数据框元素中的单词仍为“评估”。
但是,如果我这样做:
c = train.iloc[24549,3]
c = c.replace('assessories','accessories')
c
>>>> '3/4 in pvc accessories'
我仍然在摸不着头脑。我不想迭代df,而是做一个矢量化实现。你有什么想法怎么做吗?
答案 0 :(得分:1)
正确的命令不是
train = train.replace('assessories','accessories')
但是
train = train.str.replace('assessories','accessories')
感谢我的朋友Lucas Eustaquio指出这一点。