合并来自hive中两个不同表的数据

时间:2014-07-29 12:51:11

标签: hive

我需要在hive中组合来自两个不同表的数据。像R.中的cbind一样,我有一个包含一列的表,如:

patient_data

patient_id
   5
   25
   563

probable_data

 prob
  .25
  .69
  .67

我需要这样做:

patient_id    probable_data
   5               .25
   25              .69
   563             .67

我试过了

 SELECT patient_data.patient_id,probable_data.prob FROM patient_data,probable_data;

但我收到错误

失败:ParseException行3:19错过了EOF,''靠近' patients_check'

如何在蜂巢中完成。 感谢

1 个答案:

答案 0 :(得分:0)

虽然您编写的命令应该有效:

 SELECT patient_data.patient_id,probable_data.prob FROM patient_data,probable_data;

但是尝试使patient.probable_data.变红,这样你的命令就会像

 SELECT patient_id, prob FROM patient_data, probable_data;

加入数据做

hive> SELECT patient_data.patient_id, probable_data.prob
      >FROM patient_di JOIN patient_data ON patient_data.patient_id = probable_data.prob;

在这两种情况下,您可能需要将patient_data.patient_id = probable_data.prob作为(patient_data.patient_id = probable_data.prob)