合并两个没有后缀的数据框

时间:2018-11-18 15:28:44

标签: python pandas dataframe merge

告诉我如何结合两个DataFrame。 接下来的任务是,我需要在字段left_on ='component_id_1',right_on ='component_id'的字段中合并两个DataFrame bill_of_materials_component_id_1和comp_boss

第一个DataFrame

  

bill_of_materials_component_id_1

带有字段

Index(['tube_assembly_id', 'component_id_1', 'quantity_1', 'name_component_id',
       'component_type_id', 'name_component_type_id', 'type',
       'connection_type_id', 'name_type_connection', 'outside_shape',
       'base_type', 'height_over_tube', 'bolt_pattern_long',
       'bolt_pattern_wide', 'groove', 'base_diameter', 'shoulder_diameter',
       'unique_feature', 'orientation', 'weight'],
      dtype='object')

第二个数据帧

  

comp_boss

带有字段

Index(['component_id', 'name_component_id', 'component_type_id',
   'name_component_type_id', 'type', 'connection_type_id',
   'name_type_connection', 'outside_shape', 'base_type',
   'height_over_tube', 'bolt_pattern_long', 'bolt_pattern_wide', 'groove',
   'base_diameter', 'shoulder_diameter', 'unique_feature', 'orientation',
   'weight'],
  dtype='object')

您会看到有相同的字段

团结如下

bill_of_materials_component_id_1 = bill_of_materials_component_id_1.merge(comp_boss,
                                        left_on='component_id_1',right_on='component_id',how='left').drop(columns={'component_id'})

合并时,这就是

Index(['tube_assembly_id', 'component_id_1', 'quantity_1',
   'name_component_id_x', 'component_type_id_x',
   'name_component_type_id_x', 'type_x', 'connection_type_id_x',
   'name_type_connection_x', 'outside_shape_x', 'base_type_x',
   'height_over_tube_x', 'bolt_pattern_long_x', 'bolt_pattern_wide_x',
   'groove_x', 'base_diameter_x', 'shoulder_diameter_x',
   'unique_feature_x', 'orientation_x', 'weight_x', 'name_component_id_y',
   'component_type_id_y', 'name_component_type_id_y', 'type_y',
   'connection_type_id_y', 'name_type_connection_y', 'outside_shape_y',
   'base_type_y', 'height_over_tube_y', 'bolt_pattern_long_y',
   'bolt_pattern_wide_y', 'groove_y', 'base_diameter_y',
   'shoulder_diameter_y', 'unique_feature_y', 'orientation_y', 'weight_y'],
  dtype='object')

是否可以这样做,以便不创建带有x和y后缀的字段,而是将它们添加到现有字段中?

对不起,我的英语

0 个答案:

没有答案