stanford-nlp - 如何自定义Stanford Classifier以获得管道执行方式？

我正在使用Stanford NLP Classifier并且非常了解如何使用命令行运行并通过ClassifierDemo.java以编程方式运行，这是stanford在下载文件中提供的示例文件。我也很清楚在配置/属性文件中设置程序作为输入所需的所有必要参数。有了这些知识，我只是想知道我是否能够满足以下情况。

我只知道stanford nlp分类器执行诸如词干化，词形还原，pos标记器，NER，基于正则表达式的分词，标记化，特征向量的构建，为每个单独的特征分配权重等操作。我只是在寻找一种管道方式来解决所有这些操作。即将一步输出作为输入馈送到下一步，直到产生最终输出。另外我知道在stfford分类器的pdf讲义和维基页面中找到了足够的解释，并亲自尝试在属性/配置文件中使用printTo，但这仍然不足以满足我的需要。

简而言之，寻找一种管道式的工作方式，这样我需要在每个单独的操作之后获得输出，并再次将相同的文件作为输入提供给下一个操作。虽然java文档随包提供，但stanford在其当前下载中没有提供源代码。也可以在每个操作之后生成输出，例如词形还原，词干，pos标记，NER，基于正则表达式的分词，标记化，特征向量的建立，为每个单独的特征分配权重，构建类模型......等。

如何自定义Stanford Classifier以获得管道执行方式？

0 个答案: