如何从SQL Server中的单个行中提取多个字符串

时间:2011-01-30 13:21:21

标签: sql sql-server pattern-matching

我有例如下表数据:

id    |    text
--------------------------------------------------------------------------------
1     |  Peter (Peter@peter.de) and Marta (marty@gmail.com) are doing fine.
2     |  Nothing special here
3     |  Another email address (me@my.com)

现在我需要一个选择,返回我的文本列中的所有电子邮件地址(可以只检查括号),如果文本中有多个地址,则返回多行柱。我知道how to extract the first element,但我对如何找到第二个和更多结果完全不了解。

3 个答案:

答案 0 :(得分:6)

您可以递归使用cte去除字符串。

declare @T table (id int, [text] nvarchar(max))

insert into @T values (1, 'Peter (Peter@peter.de) and Marta (marty@gmail.com) are doing fine.')
insert into @T values (2, 'Nothing special here')
insert into @T values (3, 'Another email address (me@my.com)')

;with cte([text], email)
as
(
    select
        right([text], len([text]) - charindex(')', [text], 0)),
        substring([text], charindex('(', [text], 0) + 1, charindex(')', [text], 0) - charindex('(', [text], 0) - 1) 
    from @T
    where charindex('(', [text], 0) > 0
    union all
    select
        right([text], len([text]) - charindex(')', [text], 0)),
        substring([text], charindex('(', [text], 0) + 1, charindex(')', [text], 0) - charindex('(', [text], 0) - 1) 
    from cte
    where charindex('(', [text], 0) > 0
)
select email
from cte

结果

email
Peter@peter.de
me@my.com
marty@gmail.com

答案 1 :(得分:2)

假设没有流氓括号,如果您的文本可以包含任何XML实体字符,则需要添加一些额外的replace

WITH basedata(id, [text])
     AS (SELECT 1, 'Peter (Peter@peter.de) and Marta (marty@gmail.com) are doing fine.'
         UNION ALL
         SELECT 2, 'Nothing special here'
         UNION ALL
         SELECT 3, 'Another email address (me@my.com)'),
     cte(id, t, x)
     AS (SELECT *,
                CAST('<foo>' + REPLACE(REPLACE([text],'(','<bar>'),')','</bar>') + '</foo>' AS XML)
         FROM   basedata)
SELECT id,
       a.value('.', 'nvarchar(max)') as address
FROM   cte
       CROSS APPLY x.nodes('//foo/bar') as addresses(a) 

答案 2 :(得分:-2)

子字符串函数具有起始位置参数。因此,您会找到第一个匹配项,并在出现位置+ occurenceLength处开始下一个搜索(在循环中)。您需要编写一个函数,该函数将值作为分隔的字符串或表返回。使用@ -sign查找进入电子邮件地址的方式,然后向后和向前扫描,直到您到达空格或电子邮件地址(或起始位置或开头或最后一个字符)中无效的字符。 / p>