使用Python进行数据清理

时间:2018-08-30 03:13:25

标签: python excel python-3.x

我有一个不一致的数据集,我想消除以$符号开头的单词,并代替删除的单词,我想保留删除的单词之后的下一个单词。如何解决这个问题。

第一天苹果香蕉土豆$ aarb葡萄菠萝


DAY2苹果香蕉$ aarb土豆葡萄菠萝


DAY3苹果香蕉$ aarb土豆味

例如:如果我从第一行中删除$ aarb,则下一个单词GRAPES必须代替$ aarb,而PINEAPPLE必须代替GRAPES。

请任何人帮助我。预先感谢。

1 个答案:

答案 0 :(得分:0)

import csv
import re

with open('test.csv') as csvfile:
    readCSV = csv.reader(csvfile,delimiter=',')
    for row in readCSV:
        r = re.compile('[^$]')
        newlist = list(filter(r.match,row))
        print(newlist)

随意替换为print(newlist),您可以写入文件或将其输出到其他地方。