python corenlp批处理解析

时间:2015-03-10 07:46:53

标签: python batch-processing stanford-nlp

我正在尝试使用corenlp python包装器批量解析文档。 batch_parse()给出了生成器,当我尝试迭代这个生成器时,它给了我以下错误:

  

无效的最大堆大小:-XmxTrue   错误:无法创建Java虚拟机。

这是我的代码:

from corenlp 
import batch_parse 
corenlp_dir = "stanford-corenlp-full-2014-08-27/" 
raw_text_directory = "sample_raw_text/" 
for value in batch_parse(raw_text_directory, corenlp_dir,True): 
  print value

当我在batch_parse提供的生成器上移除for循环时,它不会给出此错误。所以,我猜错误与迭代生成器相关。

如何解决此错误?

1 个答案:

答案 0 :(得分:0)

这是我的错。我在batch_parse的参数传递中错过了“raw_output”。所以,它应该是这样的:

for value in batch_parse(raw_text_directory, corenlp_dir,raw_output=True):
	print value