使用Map Reduce和MongoDB的N-Grams

时间:2016-04-26 12:58:29

标签: python mongodb mapreduce nlp n-gram

我有兴趣根据现有的集合(让我们称之为X)句子将新集合添加到MongoDB中的现有数据库。新集合应该包含X集合N-Grams(实际上N = 2和N = 3)。

我有一个使用Map Reduce创建BOW并将其保存在MongoDB上的工作函数,但我对Map Reduce的了解有限,所以我们真的不知道需要更改什么才能将它用于N-Grams。

我现有的BOW Map Reduce功能是(我附上它,因为我相信需要进行一些小改动):

|-- app-module (main module)
    |-- /* application code and resources */
    |-- build.gradle
|-- library-module
    |-- buildSrc
        |-- CodeGenerator.groovy /* within its package */
        |-- build.gradle
    |-- build.gradle /* depends on CodeGenerator.groovy */

0 个答案:

没有答案