我有兴趣根据现有的集合(让我们称之为X)句子将新集合添加到MongoDB中的现有数据库。新集合应该包含X集合N-Grams(实际上N = 2和N = 3)。
我有一个使用Map Reduce创建BOW并将其保存在MongoDB上的工作函数,但我对Map Reduce的了解有限,所以我们真的不知道需要更改什么才能将它用于N-Grams。
我现有的BOW Map Reduce功能是(我附上它,因为我相信需要进行一些小改动):
|-- app-module (main module)
|-- /* application code and resources */
|-- build.gradle
|-- library-module
|-- buildSrc
|-- CodeGenerator.groovy /* within its package */
|-- build.gradle
|-- build.gradle /* depends on CodeGenerator.groovy */