我正在使用Stanford NLP Classifier并且非常了解如何使用命令行运行并通过ClassifierDemo.java以编程方式运行,这是stanford在下载文件中提供的示例文件。我也很清楚在配置/属性文件中设置程序作为输入所需的所有必要参数。有了这些知识,我只是想知道我是否能够满足以下情况。
我只知道stanford nlp分类器执行诸如词干化,词形还原,pos标记器,NER,基于正则表达式的分词,标记化,特征向量的构建,为每个单独的特征分配权重等操作。我只是在寻找一种管道方式来解决所有这些操作。即将一步输出作为输入馈送到下一步,直到产生最终输出。另外我知道在stfford分类器的pdf讲义和维基页面中找到了足够的解释,并亲自尝试在属性/配置文件中使用printTo,但这仍然不足以满足我的需要。
简而言之,寻找一种管道式的工作方式,这样我需要在每个单独的操作之后获得输出,并再次将相同的文件作为输入提供给下一个操作。 虽然java文档随包提供,但stanford在其当前下载中没有提供源代码。也可以在每个操作之后生成输出,例如词形还原,词干,pos标记,NER,基于正则表达式的分词,标记化,特征向量的建立,为每个单独的特征分配权重,构建类模型......等。