将电话号码格式化为美国格式(###)###-####

时间:2019-10-07 16:20:58

标签: sql sql-server format substring phone-number

我正在尝试将SQL Server数据库中的大约1000个电话号码重新格式化为美国格式(###) ###-####

当前,电话号码的格式多种多样,从##########,###-###-####,其中一个是###)-### -####。还有一个只有六位数。

第一步,我一直在尝试隔离所有这些行中的数字,但返回的数字却与原来相同。

select SUBSTRING(phone, PATINDEX('%[0-9]%', phone), LEN(phone)) from people

我怎样才能最好地编写一个将它们全部格式化为(###) ###-####的查询?

预期输出:

(555) 222-3333
(555) 444-3030
(555) 092-0920
(555) 444-4444

2 个答案:

答案 0 :(得分:1)

由于已经提出了一个建议,并且在那里隔离字符串中的建议使用了while循环,因此我需要发布一种不使用任何循环的替代方法。相反,它使用计数或数字表。有很多解决方案。我喜欢使用闪电般快速且读取次数为零的视图。

这是我的理货单的版本。

create View [dbo].[cteTally] as

WITH
    E1(N) AS (select 1 from (values (1),(1),(1),(1),(1),(1),(1),(1),(1),(1))dt(n)),
    E2(N) AS (SELECT 1 FROM E1 a, E1 b), --10E+2 or 100 rows
    E4(N) AS (SELECT 1 FROM E2 a, E2 b), --10E+4 or 10,000 rows max
    cteTally(N) AS 
    (
        SELECT  ROW_NUMBER() OVER (ORDER BY (SELECT NULL)) FROM E4
    )
select N from cteTally

接下来,我们需要一个表值函数来使用计数表删除不是数字的字符。这也非常快,因为我们使用的是提示表而不是循环。

create function GetOnlyNumbers
(
    @SearchVal varchar(8000)
) returns table as return

    with MyValues as
    (
        select substring(@SearchVal, N, 1) as number
            , t.N
        from cteTally t 
        where N <= len(@SearchVal)
            and substring(@SearchVal, N, 1) like '[0-9]'
    )

    select distinct NumValue = STUFF((select number + ''
                from MyValues mv2
                order by mv2.N
                for xml path('')), 1, 0, '')
    from MyValues mv

现在,我们已完成所有腿部工作,我们可以专注于手头的任务。由于您没有提供任何样本数据,因此我做了一些工作。我真的不确定这是否代表您的数据,但这对我创建的样本数据有效。

if OBJECT_ID('tempdb..#Something') is not null
    drop table #Something

create table #Something(SomeVal varchar(100))

insert #Something values
('Maybe you have other stuff in here. 5552223333 additional characters can cause grief')
, ('321-654-9878')
, ('123)-333-4444')
, ('1234567')

select replace(format(try_convert(bigint, n.NumValue), '(###) ###-####'), '() ', '')
    , n.NumValue
from #Something s
cross apply dbo.GetOnlyNumbers(s.SomeVal) n

格式化数据的输出如下:

(555) 222-3333
(321) 654-9878
(123) 333-4444
123-4567

答案 1 :(得分:0)

如果重新格式化某些将要重复使用的内容,那么按照@GSerg的建议创建一个UDF将是可行的方法。

如果这只是一次清理,则可以尝试一下。

首先用一系列嵌套的REPLACE()函数将所有数字替换为空字符串。

DECLARE @PhoneNumbers TABLE (

Number varchar (20))

INSERT INTO @PhoneNumbers VALUES ('(888-239/1239')
INSERT INTO @PhoneNumbers VALUES ('222.1234')

SELECT 
REPLACE(
    REPLACE(
        REPLACE(
            REPLACE(
                REPLACE(
                    REPLACE(
                        REPLACE(
                            REPLACE(
                                REPLACE(
                                    REPLACE(Number, '0', '')
                                , '1', '')
                            , '2', '')
                        , '3', '')
                    , '4', '')
                , '5', '')
            , '6', '')
        , '7', '')
    , '8', '')
, '9', '')
FROM @PhoneNumbers

然后将那些结果非数字字符放入各自的嵌套REPLACE()函数中并格式化结果。您将不得不分别处理每个长度。如果您只有7位数字,并且想要将其格式化为10位数字,那么您希望这些多余的3位数字是多少。这将处理10位数字的电话号码。

SELECT FORMAT(x.NumbersOnly, '(###) ###-####')
FROM 
(
    SELECT 
    CONVERT(BIGINT,
        REPLACE(
            REPLACE(
                REPLACE(
                    REPLACE(Number, '(', '')
                , '-', '')
            , '/', '')
        , '.', '')
    ) AS NumbersOnly
    FROM @PhoneNumbers
) x
WHERE LEN(x.NumbersOnly) = 10

这里是dbfiddle