我正在使用SQL Server 2008,并尝试清理URL列表。
一些现有的文本示例:
www.google.com
'www.google.com'
/www.google.com
www.google.com/
理想情况下,我可以剥离任何前导/后缀的非字母数字字符,因此这四个字符将给出与
相同的输出www.google.com
答案 0 :(得分:2)
好吧,如果您知道它们只是在开头和结尾,则可以执行以下操作:
with t as (
select *
from (values ('www.google.com'), ('''www.google.com'''), ('/www.google.com')) v(text)
)
select t.text, v2.text2
from t cross apply
(values (stuff(t.text, 1, patindex('%[a-zA-Z0-9]%', t.text) - 1, ''))
) v(text1) cross apply
(values (case when v.text1 like '%[^a-zA-Z0-9]'
then stuff(v.text1, len(text) + 1 - patindex('%[a-zA-Z0-9]%', reverse(v.text1)), len(v.text1), '')
else v.text1
end)
) v2(text2);
Here是db <>小提琴。
答案 1 :(得分:0)
为什么不只使用replace()
?:
SELECT REPLACE(REPLACE(col, '''', ''), '/', '')
答案 2 :(得分:0)
您应该可以使用Substring。计算长度可能很棘手:
DECLARE @temp TABLE (val varchar(100))
INSERT INTO @temp VALUES
('www.google.com'),('''www.google.com'''),('/www.google.com'),('www.google.com/'),('[www.google.com];')
SELECT SUBSTRING(val
,PATINDEX('%[a-zA-Z0-9]%', val) --start at position
,LEN(val) + 2 - PATINDEX('%[a-zA-Z0-9]%', val)
- PATINDEX('%[a-zA-Z0-9]%', REVERSE(val)) --length of substring
) AS [Result]
FROM @temp
产生输出:
Result
--------------
www.google.com
www.google.com
www.google.com
www.google.com
www.google.com