如何在Hive中生成n-gram

时间:2019-10-18 13:13:40

标签: sql hive

如何在Hive中生成n-gram?

我只知道1克是

select split("abcd", "|")

输出为[“ a”,“ b”,“ c”,“ d”,“”]

我知道How to generate all n-grams in Hive可以用单词做n-gram。但是我想用只包含'a'-'z'且没有空格或逗号的字符串做n-gram

例如 输入字符串“ abcde”

输出2克文字:[“ ab,” bc“,” cd“,” de“]

0 个答案:

没有答案