将数据存储在HBASE中而不指定架构

时间:2016-11-08 10:14:10

标签: hadoop hbase apache-pig bigdata

我正在尝试使用pig将数据存储在 HBASE 中,但我发现的所有示例都需要在 Pig 中创建模式。如果没有创建模式,我怎么能实现这一点,因为我的数据可以有不同数量的字段。需要帮助。

修改

我有HL7数据,格式如下

MSH|^~\&|Roqua|RGOc|||20121120113522||ORU^R01|8da2b665b7|P|2.4|||||||
PID|1||123^^^^^^^|||||||||||||||||||||||||||
OBR|1||2599||||201211201139||||||||mansa||||||||||S
OBX|1|ST|mansa_protocol^MANSA Protocol^L||ROM||||||S|||201211201139
OBX|2|ST|mansa_project^MANSA Project^L||Meettraject 1||||||S|||201211201139
OBX|3|ST|mansa_measurement^MANSA Measurement^L||Evaluatie||||||S|||201211201139
OBX|4|ST|mansa_notes^MANSA Notes^L||||||||S|||201211201139
OBX|5|ST|mansa_location^MANSA Location^L||||||||S|||201211201139
OBX|6|ST|mansa_compl_by^MANSA Completed By^L||123||||||S|||201211201139
OBX|7|NM|mansa_totaal^MANSA Score^L||||||||S|||201211201139
OBX|8|ST|mansa_1^MANSA v_1^L||||||||S|||201211201139
OBX|9|ST|mansa_6^MANSA v_6^L||||||||S|||201211201139
OBX|10|ST|mansa_7^MANSA v_7^L||||||||S|||201211201139
OBX|11|ST|mansa_8^MANSA v_8^L||||||||S|||201211201139
OBX|12|ST|mansa_9^MANSA v_9^L||||||||S|||201211201139
OBX|13|ST|mansa_10^MANSA v_10^L||||||||S|||201211201139
OBX|14|ST|mansa_11^MANSA v_11^L||||||||S|||201211201139
OBX|15|ST|mansa_12^MANSA v_12^L||||||||S|||201211201139
OBX|16|ST|mansa_13^MANSA v_13^L||||||||S|||201211201139
OBX|17|ST|mansa_14^MANSA v_14^L||||||||S|||201211201139
OBX|18|ST|mansa_15^MANSA v_15^L||||||||S|||201211201139
OBX|19|ST|mansa_16^MANSA v_16^L||||||||S|||201211201139
OBX|20|ST|mansa_17^MANSA v_17^L||||||||S|||201211201139
OBX|21|ST|mansa_18^MANSA v_18^L||||||||S|||201211201139
OBX|22|ST|mansa_19^MANSA v_19^L||||||||S|||201211201139
OBX|23|ST|mansa_20^MANSA v_20^L||||||||S|||201211201139

我不知道如何在HBASE中存储它,因为单个HL7文件中可能有多个MSH,OBR和OBX。

0 个答案:

没有答案