我是实体框架的新手。我需要在数据库中存储的文本中搜索“约翰尼”一词。文本来自pdf文件。因此,文本列中有很多单词。
这是我的代码
using (var d = new DatabaseContext())
{
var l = d.Pages.Where(x => x.Text.ToLower().Contains(text.ToLower())).ToList();
}
到目前为止,代码正在运行。
但是要求改变了。如果用户键入jhonny bravo
,则程序将必须在jhonny
列中搜索单词bravo
和Text
。即使jhonny
列中的单词是,也应该找到bravo
和Text
Jhonny is bravo
jhonny is not bravo
我该如何解决?
我想到了拆分文本并搜索每个单词的想法
using (var d = new DatabaseContext())
{
var split = Regex.Split(text, @"\s+");
if (split.Count() > 1)
{
var l = d.Pages.Where(x => x.Text.ToLower().Contains(text.ToLower())).ToList();
}
}
但是使用上面的代码。如何创建动态搜索?如果搜索词包含6个单词怎么办?我该如何查询?谢谢。
答案 0 :(得分:1)
您可以根据Where
个条件创建word
链:
using (var db = new DatabaseContext())
{
var words = Regex.Split(text, @"\s+");
var query = db.Pages.AsQuerable();
foreach(var word in words)
query = query.Where(x => x.Text.ToLower().Contains(word.ToLower()));
var answer = query.ToList();
}
答案 1 :(得分:0)
在这里,我将文本分割为空格,然后我们获得文本中每个单词的列表。
我还使用方法Distinct()
删除所有重复的单词,我不确定是否可以提高性能,但是如果您不喜欢它,则可以删除它。
var keywords = ["john", "bravo", "hello"]
var l = d.Pages
.Where(page => {
var words = page.Text.ToLower().Split(' '). Distinct();
foreach(var keyword in keywords) {
if (!words.Contains(keyword.ToLower())
return false;
}
return true;
}
)
.ToList();
// "john," "johnnxx" will also count as true