说我有句This is a new city
答案 0 :(得分:0)
这取决于您的tokenizer。默认情况下,Elasticsearch使用Standant Tokenizer divides text into terms on word boundaries, as defined by the Unicode Text Segmentation algorithm.
这意味着您的句子将被标记为this, is, a, new, city
。如果您愿意,可以创建自定义标记生成器。
将文档放入Elasticsearch时会对文档编制索引。
数据保存在文件系统中:https://www.elastic.co/blog/found-dive-into-elasticsearch-storage
以下是关于内部的博文:https://www.elastic.co/blog/found-elasticsearch-from-the-bottom-up