我正在使用Python进行弹性搜索。我找不到用口音进行不敏感搜索的方法。
例如: 我有两个字。 “Camión”和“ Camion ”。 当用户搜索“camion”时,我希望显示两个结果。
创建索引:
es = Elasticsearch([{u'host': u'127.0.0.1', u'port': b'9200'}])
es.indices.create(index='name', ignore=400)
es.index(
index="name",
doc_type="producto",
id=p.pk,
body={
'title': p.titulo,
'slug': p.slug,
'summary': p.summary,
'description': p.description,
'image': foto,
'price': p.price,
'wholesale_price': p.wholesale_price,
'reference': p.reference,
'ean13': p.ean13,
'rating': p.rating,
'quantity': p.quantity,
'discount': p.discount,
'sales': p.sales,
'active': p.active,
'encilleria': p.encilleria,
'brand': marca,
'brand_title': marca_titulo,
'sellos': sellos_str,
'certificados': certificados_str,
'attr_naturales': attr_naturales_str,
'soluciones': soluciones_str,
'categories': categories_str,
'delivery': p.delivery,
'stock': p.stock,
'consejos': p.consejos,
'ingredientes': p.ingredientes,
'es_pack': p.es_pack,
'temp': p.temp,
'relevancia': p.relevancia,
'descontinuado': p.descontinuado,
}
搜索:
from elasticsearch import Elasticsearch
es = Elasticsearch([{'host': '127.0.0.1', 'port': '9200'}])
resul = es.search(
index="name",
body={
"query": {
"query_string": {
"query": "(title:" + search + " OR description:" + search + " OR summary:" + search + ") AND (active:true)",
"analyze_wildcard": False
}
},
"size": "9999",
}
)
print resul
我在谷歌,Stackoverflow和elastic.co上搜索过,但我找不到任何有用的东西。
答案 0 :(得分:3)
您需要更改查询中的字段映射。更改映射需要重新编制索引,以便对字段进行不同的分析,并且查询将起作用。
基本上,您需要以下内容。名为text
的字段只是一个例子。您还需要为其他字段应用相同的设置。请注意,我在其中使用了fields
,以便根字段将保留默认分析的原始文本,而text.folded
将删除重音字符,并使您的查询可以正常工作。我还更改了一下查询,以便您搜索该字段的两个版本(camion
将匹配,但camión
)。
PUT /my_index
{
"settings": {
"analysis": {
"analyzer": {
"folding": {
"tokenizer": "standard",
"filter": [
"lowercase",
"asciifolding"
]
}
}
}
},
"mappings": {
"test": {
"properties": {
"text": {
"type": "string",
"fields": {
"folded": {
"type": "string",
"analyzer": "folding"
}
}
}
}
}
}
}
查询:
"query": {
"query_string": {
"query": "\\*.folded:camion"
}
}
此外,我强烈建议您阅读文档的这一部分:https://www.elastic.co/guide/en/elasticsearch/guide/current/asciifolding-token-filter.html