我有一个不一致的数据集,我想消除以$符号开头的单词,并代替删除的单词,我想保留删除的单词之后的下一个单词。如何解决这个问题。
第一天苹果香蕉土豆$ aarb葡萄菠萝
DAY2苹果香蕉$ aarb土豆葡萄菠萝
DAY3苹果香蕉$ aarb土豆味
例如:如果我从第一行中删除$ aarb,则下一个单词GRAPES必须代替$ aarb,而PINEAPPLE必须代替GRAPES。
请任何人帮助我。预先感谢。
答案 0 :(得分:0)
import csv
import re
with open('test.csv') as csvfile:
readCSV = csv.reader(csvfile,delimiter=',')
for row in readCSV:
r = re.compile('[^$]')
newlist = list(filter(r.match,row))
print(newlist)
随意替换为print(newlist)
,您可以写入文件或将其输出到其他地方。