借助SAP HANA,您可以进行文本分析,全文搜索甚至情绪分析。
在SAP HANA中自定义组织化的选项有哪些?
我知道我可以为spezial单词创建自定义词典。例如,我可以让HANA将“堆栈溢出”识别为单个实体/令牌。
但有时HANA会从多个单词中创建令牌,这些单词不是一个令牌/实体,例如'SAP体验'在这里,我想要2个令牌'和'经验'(不是'经验')
那么如何自定义tokanization(自定义词典除外)
答案 0 :(得分:0)
我偶然发现了这些信息,并认为如果它有帮助我会传递它。
查看可用于自定义HANA中文本索引的众多参数。要查看全文索引的配置,请使用SYS.FULLTEXT_INDEXES视图。您对PHRASE INDEX RATIO有什么价值?