我使用solr 6.3进行一些练习。
我在solr UI上使用文档部分和文档
<doc>
<field name="id">a</field>
<field name="stuff">Adobe Acrobat Readef</field>
</doc>
也可以使用命令
在终端上使用curlcurl "http://localhost:8983/solr/tt/update/extract?literal.id=t&uprefix=attr_&fmap.content=stuff&commit=true" -F "myfile=@a.pdf"
我映射&#34;东西&#34;我的架构上的字段,其测试字段类型名为&#34; z_field&#34;通过这样做。
<fieldType name="z_field" class="solr.TextField" positionIncrementGap="100">
<analyzer type="index">
<tokenizer class="solr.StandardTokenizerFactory"/>
<filter class="solr.LowerCaseFilterFactory"/>
</analyzer>
<analyzer type="query">
<tokenizer class="solr.StandardTokenizerFactory"/>
<filter class="solr.LowerCaseFilterFactory"/>
</analyzer>
</fieldType>
<field name="stuff" type="z_field"/>
虽然,我在solr UI上的Analysis部分用随机短语成功了。当我使用前面的两个命令更新字段&#34; stuff&#34;仍然是大写字母。
所以,我错过了什么。因为我为文本定义了field和fieldType。
感谢。
答案 0 :(得分:0)
来自文档
分析器的输出会影响给定字段中索引的术语 (以及解析针对这些字段的查询时使用的术语)但它 对字段的存储值没有影响。例如:a 分析器可能将“Brown Cow”分成两个索引术语“棕色”和 “牛”,但存储的值仍然是一个字符串:“布朗牛”