Question

我只想从数据中提取符号和数字

输入：<70 (aze) , <0,03 (+) , >0.03 (+)
输出：<70 , <0,03 , >0.03

尝试使用 re.sub 但我无法选择标志

re.sub("\D", "", text)

Answer 1

你可以使用

" , ".join(re.findall(r'[<>]?\d+(?:[.,]\d+)?', text))

参见regex demo。详情：

import re
text = '<70 (aze) , <0,03 (+) , >0.03 (+)'
print( " , ".join(re.findall(r'[<>]?\d+(?:[.,]\d+)?', text)) )
# => <70 , <0,03 , >0.03

在熊猫中：

df['text'] = df['text'].str.findall(r'[<>]?\d+(?:[.,]\d+)?').str.join(' , ')