如何在SAP HANA全文搜索索引中自定义tokanization

时间:2014-11-03 14:41:02

标签: customization sap tokenize hana

借助SAP HANA,您可以进行文本分析,全文搜索甚至情绪分析。

在SAP HANA中自定义组织化的选项有哪些?

我知道我可以为spezial单词创建自定义词典。例如,我可以让HANA将“堆栈溢出”识别为单个实体/令牌。

但有时HANA会从多个单词中创建令牌,这些单词不是一个令牌/实体,例如'SAP体验'在这里,我想要2个令牌'和'经验'(不是'经验')

那么如何自定义tokanization(自定义词典除外)

1 个答案:

答案 0 :(得分:0)

我偶然发现了这些信息,并认为如果它有帮助我会传递它。

查看可用于自定义HANA中文本索引的众多参数。要查看全文索引的配置,请使用SYS.FULLTEXT_INDEXES视图。您对PHRASE INDEX RATIO有什么价值?

完整来源:http://help.sap.com/saphelp_hanaplatform/helpdata/en/cc/c504cebb571014badd88b622a24cae/content.htm?frameset=/en/f5/ceb3d471bf4ec0bf5a77351c1f035d/frameset.htm&current_toc=/en/fd/c71ac6a10b43cd97ff1bee7a3c3aab/plain.htm&node_id=21&show_children=false