查询以获取两个字符串之间的常用单词

时间:2012-12-13 16:43:05

标签: sql sql-server sql-server-2012

我需要一个SQL查询来获取两个句子之间的常用词。例如:

句子1:这个网站非常有帮助

句子2:我需要一个有用的网站

结果应该是:网站有用

另外,如果我需要将句子1与表字段记录进行比较以获得包含句子1中最常见单词的记录,我该怎么办?

1 个答案:

答案 0 :(得分:1)

你问题标题是MSQL,所以我把你的问题作为Sql Server问题。

  1. 分割功能
  2. 根据SQL Server版本/服务器配置,您需要一个可以在选择的分隔符上拆分字符串的拆分函数。这是一个这样的功能。

    CREATE FUNCTION [dbo].[fnSplit](@data NVARCHAR(MAX), @delimiter NVARCHAR(5))
    RETURNS @t TABLE (rowNum int IDENTITY(1,1), data NVARCHAR(max), descriptor varchar(255) NULL)
    AS
    BEGIN
    
        DECLARE @textXML XML;
        SELECT    @textXML = CAST('<d>' + REPLACE(@data, @delimiter, '</d><d>') + '</d>' AS XML);
    
        INSERT INTO @t(data)
        SELECT  RTRIM(LTRIM(T.split.value('.', 'nvarchar(max)'))) AS data
        FROM    @textXML.nodes('/d') T(split)
    
        RETURN
    END
    
    1. 使用split函数查询常用单词(有很多方法可以做到这一点,这里是一个)。 SELECT sentence1.data FROM dbo.fnSplit('This site is very helpful',' ') sentence1 INNER JOIN dbo.fnSplit('I need a helpful site',' ') sentence2 ON sentence1.data = sentence2.data