将用户输入的搜索字词转换为可用于where子句进行全文搜索以查询表格并获取相关结果的查询的最佳方法是什么?例如,用户输入以下查询:
+"e-mail" +attachment -"word document" -"e-learning"
应该转化为:
SELECT * FROM MyTable WHERE (CONTAINS(*, '"e-mail"')) AND (CONTAINS(*, '"attachment"')) AND (NOT CONTAINS(*, '"word document"')) AND (NOT CONTAINS(*, '"e-learning"'))
我目前正在使用query parser class,它使用正则表达式将用户输入的查询解析为标记,然后从标记构造where子句。
然而,鉴于这可能是许多使用全文搜索的系统的常见要求,我很好奇其他开发人员如何处理这个问题,以及是否有更好的做事方式。
答案 0 :(得分:8)
如何使用.Net / C#/ Entity Framework实现接受的答案......
使用nuget安装Irony。
从以下位置添加示例类: http://irony.codeplex.com/SourceControl/latest#Irony.Samples/FullTextSearchQueryConverter/SearchGrammar.cs
编写这样的代码,将用户输入的字符串转换为查询。
var grammar = new Irony.Samples.FullTextSearch.SearchGrammar();
var parser = new Irony.Parsing.Parser(grammar);
var parseTree = parser.Parse(userEnteredSearchString);
string query = Irony.Samples.FullTextSearch.SearchGrammar.ConvertQuery(parseTree.Root);
也许写一个这样的存储过程:
create procedure [dbo].[SearchLivingFish]
@Query nvarchar(2000)
as
select *
from Fish
inner join containstable(Fish, *, @Query, 100) as ft
on ft.[Key] = FishId
where IsLiving = 1
order by rank desc
运行查询。
var fishes = db.SearchLivingFish(query);
答案 1 :(得分:5)
这可能不是您正在寻找的,但它可能会为您提供一些进一步的想法。
http://www.sqlservercentral.com/articles/Full-Text+Search+(2008)/64248/
答案 2 :(得分:1)
除了@franzo上面的回答,您可能还想更改SQL中的默认停用词行为。否则,包含单个数字(或其他停用词)的查询将不会返回任何结果。
根据SQL 2008: Turn off Stop Words for Full Text Search Query
中的说明,禁用停用词,创建自己的停用词列表和/或设置要转换的干扰词要查看(英文)sql停用词的系统列表,请运行:
select * from sys.fulltext_system_stopwords where language_id = 1033
答案 3 :(得分:0)
我意识到这与你原来的问题有点相差一点,但你是否考虑过远离SQL全文索引并改用Lucene/Solr之类的东西?
答案 4 :(得分:0)
最简单的方法是使用动态SQL(我知道,在此插入安全问题)并将短语分解为格式正确的字符串。
您可以使用函数将短语分解为可用于创建新字符串的表变量。
答案 5 :(得分:0)
GoldParser和Calitha的组合应该把你排除在外。
这篇文章:http://www.15seconds.com/issue/070719.htm也有一个googleToSql类,它会为你做一些翻译。