我有一个数据集,其中包含带有信用卡商人数据的字段。我想使用正则表达式对值进行预处理(“清除值”,然后再使用模糊匹配标准化字段(“期望的输出”)
[merchant] [clean value] [desired output]
UPS1Z3734A345 UPS UPS
UPS 1Z68A3125 UPS UPS
HOME DEPOT #3421 HOME DEPOT HOME DEPOT
STAPLES - #123 STAPLES STAPLES
STPLS #4560 STPLS STAPLES
我需要处理很多不同的情况(例如“-”,数值,“#”字符等)
我在正则表达式中还很陌生,但这是我到目前为止想出的内容
(.+)[?=#]
但是,仅当字符串中有“#”时才解决此问题。此外,如果字符串中没有非字母字符,则该字段返回空白
我很想获得有关如何正确制作此表情的帮助。
答案 0 :(得分:0)