从CSV文件中删除字母和符号-python 3.7

时间:2019-07-08 08:30:59

标签: python regex python-3.x csv

我得到了一个名为activity的CSV文件,其数据如下:

instv2-02_00001_20190517235008
instv2 (9)
Insti2(3)
Fbstt1_00001_20190517131933

我只需要从“活动”列中的名称中删除数字和任何其他符号(例如:_)。 这意味着只需要保留字母即可。 例如instv3-02_00001_20190517235157instv1-02_00000_20190517234840,instv1(4)...等都需要重命名/替换为instv。如何在Python脚本中执行此操作?

2 个答案:

答案 0 :(得分:1)

使用const result = db._query([name of query defined in Db], { "@arg": arg-value }).toArray(); 模块和内置的re函数:

open

答案 1 :(得分:0)

使用$OSVersion.Value,加载CSV文件并在pandas列值上应用正则表达式替换。

尝试以下代码:

activity

,如果它与您的问题here有关,那么您只需要 导入re并将解决方案的最后一行更改为:

import re
import pandas as pd

df = pd.read_csv('your_file.csv')
df['activity'] = df['activity'].apply(lambda x: re.sub(r'^([a-zA-Z]+).*', r'\1', x))
df.to_csv('output.csv', index=False)