标签: sql hive
如何在Hive中生成n-gram?
我只知道1克是
select split("abcd", "|")
输出为[“ a”,“ b”,“ c”,“ d”,“”]
我知道How to generate all n-grams in Hive可以用单词做n-gram。但是我想用只包含'a'-'z'且没有空格或逗号的字符串做n-gram
例如 输入字符串“ abcde”
输出2克文字:[“ ab,” bc“,” cd“,” de“]