我正在尝试将SQL Server数据库中的大约1000个电话号码重新格式化为美国格式(###) ###-####
当前,电话号码的格式多种多样,从##########,###-###-####,其中一个是###)-### -####。还有一个只有六位数。
第一步,我一直在尝试隔离所有这些行中的数字,但返回的数字却与原来相同。
select SUBSTRING(phone, PATINDEX('%[0-9]%', phone), LEN(phone)) from people
我怎样才能最好地编写一个将它们全部格式化为(###) ###-####
的查询?
预期输出:
(555) 222-3333
(555) 444-3030
(555) 092-0920
(555) 444-4444
答案 0 :(得分:1)
由于已经提出了一个建议,并且在那里隔离字符串中的建议使用了while循环,因此我需要发布一种不使用任何循环的替代方法。相反,它使用计数或数字表。有很多解决方案。我喜欢使用闪电般快速且读取次数为零的视图。
这是我的理货单的版本。
create View [dbo].[cteTally] as
WITH
E1(N) AS (select 1 from (values (1),(1),(1),(1),(1),(1),(1),(1),(1),(1))dt(n)),
E2(N) AS (SELECT 1 FROM E1 a, E1 b), --10E+2 or 100 rows
E4(N) AS (SELECT 1 FROM E2 a, E2 b), --10E+4 or 10,000 rows max
cteTally(N) AS
(
SELECT ROW_NUMBER() OVER (ORDER BY (SELECT NULL)) FROM E4
)
select N from cteTally
接下来,我们需要一个表值函数来使用计数表删除不是数字的字符。这也非常快,因为我们使用的是提示表而不是循环。
create function GetOnlyNumbers
(
@SearchVal varchar(8000)
) returns table as return
with MyValues as
(
select substring(@SearchVal, N, 1) as number
, t.N
from cteTally t
where N <= len(@SearchVal)
and substring(@SearchVal, N, 1) like '[0-9]'
)
select distinct NumValue = STUFF((select number + ''
from MyValues mv2
order by mv2.N
for xml path('')), 1, 0, '')
from MyValues mv
现在,我们已完成所有腿部工作,我们可以专注于手头的任务。由于您没有提供任何样本数据,因此我做了一些工作。我真的不确定这是否代表您的数据,但这对我创建的样本数据有效。
if OBJECT_ID('tempdb..#Something') is not null
drop table #Something
create table #Something(SomeVal varchar(100))
insert #Something values
('Maybe you have other stuff in here. 5552223333 additional characters can cause grief')
, ('321-654-9878')
, ('123)-333-4444')
, ('1234567')
select replace(format(try_convert(bigint, n.NumValue), '(###) ###-####'), '() ', '')
, n.NumValue
from #Something s
cross apply dbo.GetOnlyNumbers(s.SomeVal) n
格式化数据的输出如下:
(555) 222-3333
(321) 654-9878
(123) 333-4444
123-4567
答案 1 :(得分:0)
如果重新格式化某些将要重复使用的内容,那么按照@GSerg的建议创建一个UDF将是可行的方法。
如果这只是一次清理,则可以尝试一下。
首先用一系列嵌套的REPLACE()函数将所有数字替换为空字符串。
DECLARE @PhoneNumbers TABLE (
Number varchar (20))
INSERT INTO @PhoneNumbers VALUES ('(888-239/1239')
INSERT INTO @PhoneNumbers VALUES ('222.1234')
SELECT
REPLACE(
REPLACE(
REPLACE(
REPLACE(
REPLACE(
REPLACE(
REPLACE(
REPLACE(
REPLACE(
REPLACE(Number, '0', '')
, '1', '')
, '2', '')
, '3', '')
, '4', '')
, '5', '')
, '6', '')
, '7', '')
, '8', '')
, '9', '')
FROM @PhoneNumbers
然后将那些结果非数字字符放入各自的嵌套REPLACE()函数中并格式化结果。您将不得不分别处理每个长度。如果您只有7位数字,并且想要将其格式化为10位数字,那么您希望这些多余的3位数字是多少。这将处理10位数字的电话号码。
SELECT FORMAT(x.NumbersOnly, '(###) ###-####')
FROM
(
SELECT
CONVERT(BIGINT,
REPLACE(
REPLACE(
REPLACE(
REPLACE(Number, '(', '')
, '-', '')
, '/', '')
, '.', '')
) AS NumbersOnly
FROM @PhoneNumbers
) x
WHERE LEN(x.NumbersOnly) = 10
这里是dbfiddle。