SQL Server:如何从字符串中删除开头/结尾的非字母数字字符?

时间:2019-02-06 17:14:38

标签: sql sql-server regex

我正在使用SQL Server 2008,并尝试清理URL列表。

一些现有的文本示例:

www.google.com
'www.google.com'
/www.google.com
www.google.com/

理想情况下,我可以剥离任何前导/后缀的非字母数字字符,因此这四个字符将给出与

相同的输出
www.google.com

3 个答案:

答案 0 :(得分:2)

好吧,如果您知道它们只是在开头和结尾,则可以执行以下操作:

with t as (
      select *
      from (values ('www.google.com'), ('''www.google.com'''), ('/www.google.com')) v(text)
     )
select t.text, v2.text2
from t cross apply
     (values (stuff(t.text, 1, patindex('%[a-zA-Z0-9]%', t.text) - 1, ''))
     ) v(text1) cross apply
     (values (case when v.text1 like '%[^a-zA-Z0-9]'
                   then stuff(v.text1, len(text) + 1 - patindex('%[a-zA-Z0-9]%', reverse(v.text1)), len(v.text1), '')
                   else v.text1
              end)
     ) v2(text2);

Here是db <>小提琴。

答案 1 :(得分:0)

为什么不只使用replace()?:

SELECT REPLACE(REPLACE(col, '''', ''), '/', '')

答案 2 :(得分:0)

您应该可以使用Substring。计算长度可能很棘手:

DECLARE @temp TABLE (val varchar(100))
INSERT INTO @temp VALUES
 ('www.google.com'),('''www.google.com'''),('/www.google.com'),('www.google.com/'),('[www.google.com];')

SELECT SUBSTRING(val
                ,PATINDEX('%[a-zA-Z0-9]%', val) --start at position
                ,LEN(val) + 2 - PATINDEX('%[a-zA-Z0-9]%', val) 
                  - PATINDEX('%[a-zA-Z0-9]%', REVERSE(val)) --length of substring
                ) AS [Result]
  FROM @temp

产生输出:

Result
--------------
www.google.com
www.google.com
www.google.com
www.google.com
www.google.com