我使用的是ElasticSearch 5.6,我的数据通常涉及包含序数或基数的数字字符串,例如“第五”,“四十一”或“一百二十二”。我想要一个分析器,其令牌过滤器会将这些数字单词形式转化为更基本的数字形式,例如
cur.execute("INSERT INTO sir_main VALUES " + str(args_str))
psycopg2.ProgrammingError: Statement is too large. Statement Size: 58034743
bytes. Maximum Allowed: 16777216 bytes`
通过同义词执行此操作非常麻烦,并且我无法使用Pattern Replace正确执行此操作。在输入和搜索过程中,数据可能包含所有形式的数字单词,例如5 / 5th / 5 / Fifth。
这里的任何帮助将不胜感激!