如何使用python基于公共标识符合并2个excel电子表格?

时间:2018-05-22 20:50:26

标签: python excel pandas merge

我正在尝试根据唯一标识符将两个数据集合并为一个。在一个电子表格中,我有一个患者列表和一些信息,例如入学日期。在另一方面,我有他们收到的药物清单,以及医院中的单位等。每个都有一个独特的医疗标识符,将它们联系在一起。我如何使用python将所有给予患者的药物添加到主电子表格中,最好是在一个标有“药物”的栏中?

我已尝试过以下内容,但它没有将它们放入单独的列中,并且似乎没有处理日期的模式。相反,它创建了患者的多个副本。它似乎还没有复制到两个原始文件中都不存在的任何患者。

import pandas as pd
%pylab inline

drug_df = pd.read_excel(
    'C:/Users/Documents/Antibiotic Data.xls',
    parse_dates=[7, 8, 11, 17, 18],
    infer_datetime_format=True)
main_df = pd.read_excel(
    'C:/Users/Documents/Main Data.xls'
    parse_dates = [2, 3, 4],
    infer_datetime_format = True)
merged = drug_df.merge(main_df, on="MRN")
merged.to_csv("merged.csv", index=False)

以下是一些非常基本的电子表格的链接,可以让您了解我正在开始和结束的内容。

https://1drv.ms/f/s!ApoCMYBhswHzhokWfC6UILHhEqV_eA

任何提示如何从这里前进?

谢谢,

卡勒姆

0 个答案:

没有答案