我的数据库有很多相似的描述,我想将它们组合在一起,但由于数字不同,它们没有被组合在一起。那么有什么方法可以掩盖数字并使描述相同。
我们可以在Excel或Notepad ++中使用find和replace这样做,所以无论如何它都可以在SQL中实现。我知道我们可以使用函数
替换SQLREPLACE('column', 'new input', 'to be replaced')
但如何为正则表达式做,因为数字可以是任意组合。
我正在使用PostgreSQL。
一些输入: -
sample input description 123
sample input description 456
this is another description 678
this is another description 999
我想将它们转换为: -
sample input description xxx
sample input description xxx
this is another description xxx
this is another description xxx
数字可以在任何地方。
我是在红移上做的。
答案 0 :(得分:2)
您可以使用以下格式的REGEXP_REPLACE函数。
select regexp_replace ( columnthatneedtomask,'[0-9]','x' ) from table ;
请参阅以下链接以获取更多信息: -
https://docs.aws.amazon.com/redshift/latest/dg/REGEXP_REPLACE.html
答案 1 :(得分:1)
你要用
regexp_replace(col, '[[:digit:]]+', '#')
为了用一个#。
替换任意数量的数字Rextester演示:http://rextester.com/BFSP36237
如果字符串中可能出现多个数字,请使用标记'g':
regexp_replace(col, '[[:digit:]]+', '#', 'g')
Rextester演示:http://rextester.com/WHTJ51233