我需要在hive中组合来自两个不同表的数据。像R.中的cbind一样,我有一个包含一列的表,如:
patient_data
patient_id
5
25
563
和
probable_data
prob
.25
.69
.67
我需要这样做:
patient_id probable_data
5 .25
25 .69
563 .67
我试过了
SELECT patient_data.patient_id,probable_data.prob FROM patient_data,probable_data;
但我收到错误
失败:ParseException行3:19错过了EOF,''靠近' patients_check'
如何在蜂巢中完成。 感谢
答案 0 :(得分:0)
虽然您编写的命令应该有效:
SELECT patient_data.patient_id,probable_data.prob FROM patient_data,probable_data;
但是尝试使patient.
和probable_data.
变红,这样你的命令就会像
SELECT patient_id, prob FROM patient_data, probable_data;
加入数据做
hive> SELECT patient_data.patient_id, probable_data.prob
>FROM patient_di JOIN patient_data ON patient_data.patient_id = probable_data.prob;
在这两种情况下,您可能需要将patient_data.patient_id = probable_data.prob
作为(patient_data.patient_id = probable_data.prob)
。