我正在使用Apache Pig在二进制文件上运行Job。作业结果是有效的JSON,例如:
{
"filename": "hello_world.exe",
"strings":
[
"!This program cannot be run in DOS mode.",
"LRich",
".text"
]
}
有没有办法使用Pig“STORE”命令将此结果/ json-output直接保存到MongoDB?
更新(猪脚本):
register 'my.jar';
%default INPUT 'myfile.bla'
%default OUTPUT 'generic_text.out'
data = load '$INPUT' using myloader('myScript.py');
STORE data INTO '$OUTPUT';
我作业的json输出(见上文)存储在变量 data 中。目前,我的Pig脚本正在将输出写入文件 generic_text.out 。我希望将结果存储到现有的MongoDB集合中,而不是保存到文件中。
答案 0 :(得分:0)
直到我得到你的意思是你想将这个JSON直接存储到mongodb集合中作为一个新文档。好吧,我可以说你可以迭代JSON键并循环插入字段或者你可以通过字符串化JSON并将这个JSON插入某个键来做另一种方式,比如data
。
答案 1 :(得分:0)
Mongoimport是用于将json数据导入mongodb的实用工具。
请参阅以下由mongo import
文档组成的网址https://docs.mongodb.org/v3.0/reference/program/mongoimport/