我正在通过CPE配置器使用Apache cTAKES处理一批文档。我的管道包括UmlsDictionaryLookUpAnnotator
。对于每个文档,UmlsDictionaryLookUpAnnotator
从硬盘驱动器重新读取UMLS。
这会导致UmlsDictionaryLookUpAnnotator
占用大部分的运行时间:
并制作了许多I / O:
如何强制cTAKES将UMLS存储在RAM中?
我试图增加分配给cTAKES的内存,从默认的3 GB到~8 GB,但它没有帮助:
java -Dctakes.umlsuser=MY_UMLS_USERNAME -Dctakes.umlspw=MY_UMLS_PASSWORD -cp "%CTAKES_HOME%/desc/;%CTAKES_HOME%/resources/;%CTAKES_HOME%/lib/*" -Dlog4j.configuration=file:/%CTAKES_HOME%/config/log4j.xml -Xms512M -Xmx8g org.apache.uima.tools.cpm.CpmFrame