是否有人知道为什么我仍然因为以下原因而获得0:
SELECT [KnowItAll].[dbo].[VSM_CanculateTermFrequency] (
'hello hi hello by hello why'
,'hi')
GO
VSM_CanculateTermFrequency:
CREATE FUNCTION [dbo].[VSM_CanculateTermFrequency]
(
@i_Document NCHAR(4000),
@i_Term NCHAR(30)
)
RETURNS SMALLINT
AS
BEGIN
-- Declare the return variable here
DECLARE @TermFrequency SMALLINT
DECLARE @pos INT
DECLARE @nextpos INT
SELECT @pos = 0, @nextpos = 1, @TermFrequency = 0
WHILE @nextpos > 0
BEGIN
SELECT @nextpos = CHARINDEX(@i_Term,@i_Document)
SELECT @TermFrequency = CASE
WHEN @nextpos > 0 THEN @TermFrequency + 1
ELSE @TermFrequency
END
SELECT @pos = @nextpos
END
RETURN @TermFrequency
END
答案 0 :(得分:5)
问题在于您使用nchar
。实际上,您没有搜索'hi'
,而是在搜索
'hi '
您应该将两个参数的数据类型更改为nvarchar
。通过使用nchar
,系统使用空格填充值,使其变为30或4000个字符。
顺便说一下,我看到的另一个与CharIndex无关的问题总是返回零问题(这是由填充引起的),就是你没有告诉CharIndex在最后找到的术语之后进行搜索。您应该将对CharIndex的调用更改为:
CHARINDEX(@i_Term,@i_Document,@pos + 1)
(顺便说一句,我看到Gabe首先发现了这个)
答案 1 :(得分:4)
将数据类型更改为nvarchar
后,您会发现自己有一个无限循环,因为它始终从文档的开头开始搜索。你的行应该是:
SELECT @nextpos = CHARINDEX(@i_Term,@i_Document, @pos + 1)