我得到了一个名为activity
的CSV文件,其数据如下:
instv2-02_00001_20190517235008
instv2 (9)
Insti2(3)
Fbstt1_00001_20190517131933
我只需要从“活动”列中的名称中删除数字和任何其他符号(例如:_)。
这意味着只需要保留字母即可。
例如instv3-02_00001_20190517235157
,
instv1-02_00000_20190517234840
,instv1(4)...等都需要重命名/替换为instv。如何在Python脚本中执行此操作?
答案 0 :(得分:1)
使用const result = db._query([name of query defined in Db], {
"@arg": arg-value
}).toArray();
模块和内置的re
函数:
open
答案 1 :(得分:0)
使用$OSVersion.Value
,加载CSV文件并在pandas
列值上应用正则表达式替换。
尝试以下代码:
activity
,如果它与您的问题here有关,那么您只需要 导入re并将解决方案的最后一行更改为:
import re
import pandas as pd
df = pd.read_csv('your_file.csv')
df['activity'] = df['activity'].apply(lambda x: re.sub(r'^([a-zA-Z]+).*', r'\1', x))
df.to_csv('output.csv', index=False)