我正在使用共同参考解决方案,我们将各种功能合并并逐一执行以获得最终结果。
所有可执行文件都来自不同的开源提供程序。实现NER,POS,Parsing等所有功能目前还不可行。所以我必须使用现有的(斯坦福最适合这个)。
问题是,需要花费很多时间逐一执行并给出结果。大约25-30秒
每次执行时,它都会编译链接文件并提供输出。无论如何要减少执行时间吗?
所有命令都在.sh
shell脚本中,我通过python文件执行它。
以下是正在执行的命令集
获取NER(命名实体识别)
java -mx700m -cp $ 1 / stanford-ner.jar edu.stanford.nlp.ie.crf.CRFClassifier -loadClassifier $ 1 / classifiers / ner-eng-ie.crf-3-all2008-distsim.ser.gz - textFile $ 2
(java jar文件)
获得POS(词性)
java -mx300m -classpath $ 1 / stanford-postagger.jar edu.stanford.nlp.tagger.maxent.MaxentTagger -model $ 1 / models / bidirectional-wsj-0-18.tagger -textFile $ 2
(java jar文件)
使用minipar解析解析文本
tools / minipar / pdemo / pdemo -p tools / minipar / data /< $ 1> $ 1.minipar
(c ++可执行文件)
检测提及
java MentionDetection $ 1
(班级档案)
java CreateNPSpan $ 1 $ 1.pred
(班级档案)
创建要素文件
java -cp。:edu.mit.jwi.jar CherryPick cr $ 1
cr联合模型
tools / svmrank / svm_classify $ 1 modelrank> $ 1.entities
(c ++可执行文件)
获得回复
java MakeResponse $ 1
(类文件)