ms sql查询计数文本列中单词的出现次数

时间:2012-04-02 11:12:24

标签: sql-server-2008 text count

我有一个名为webqueries的表,其中一列名为qQuestion,数据类型为text(sql server 2008)。我想对qQuestion中使用的字词进行计数(不包括'和','是'等)。我的目标是看一个人询问有关特定产品的问题的次数。

1 个答案:

答案 0 :(得分:0)

您可以创建一个表值函数来解析单词并将其连接到qQuestion的查询。在您的架构中,我建议您使用varchar(8000)varchar(max)代替text。同时,以下内容应该让您开始:

create function [dbo].[fnParseWords](@str varchar(max), @delimiter varchar(30)='%[^a-zA-Z0-9\_]%')
returns @result table(word varchar(max))
begin
    if left(@delimiter,1)<>'%' set @delimiter='%'+@delimiter;
    if right(@delimiter,1)<>'%' set @delimiter+='%';
    set @str=rtrim(@str);
    declare @pi int=PATINDEX(@delimiter,@str);

    while @pi>0 begin
        insert into @result select LEFT(@str,@pi-1) where @pi>1;
        set @str=RIGHT(@str,len(@str)-@pi);
        set @pi=PATINDEX(@delimiter,@str);
    end

    insert into @result select @str where LEN(@str)>0;
    return;
end
go

select COUNT(*)
from webqueries q
cross apply dbo.fnParseWords(cast(q.qQuestion as varchar(max)),default) pw
where pw.word not in ('and','is','a','the'/* plus whatever else you need to exclude */)