我一直在尝试使用mlcp脚本加载由2091个nquads组成的RDF数据集,总共表示727Mio三元组。 到目前为止我已经使用过这个命令了:
$ mlcp.sh import -username <myusername> -password <mypwd> -host localhost - port 8000 -input_file_path /home/to/path/ -output_override_graph http://mynamedgraph -mode local -input_file_type rdf
我在3205秒后得到的错误如下:“XDMP-FORESTERR:合并林文档时出错:SVC-FILWRT:文件写入错误:写入'/ var / opt / MarkLogic / Forests / Documents / 00000101 / TreeData ':设备上没有剩余空间“(详情请参见[1])。 但是我的磁盘空间仍然足够(28G左侧)。
命令中有什么奇怪的是我看不到传递数据集名称的位置。
拜托,我做错了什么?
答案 0 :(得分:0)
如果您的合并最大大小设置为默认的32Gb,并且您只有28Gb,那么它可能会尝试完成合并而没有足够的空间。此外,如果在合并失败后检查了磁盘空间,则它已经从合并中清除了文件。
重要的是要记住合并是作为单个事务处理的,如果它在事务中间用完了空间,它将回滚并且在事务期间创建的文件将被删除。
MarkLogic recommends有足够的可用空间来容纳合并,通常比数据库大50%左右。