如何将数据重新组织到pandas中的新数据框中,以这种方式显示数据中的更改?

时间:2016-11-15 16:54:09

标签: python pandas dataframe

我已经开始使用两个独立的数据帧;一个从MySQL数据库(df_database)检索到的数据库和另一个在Web数据库之后创建的数据库。 Web scrape数据框已经分为两个--df_new(当前不在数据库中的行)和df_existing(数据库中已存在的行)。

从这里开始,我已经分析了df_exsiting数据框,以找到我感兴趣的df_existing数据框中的两列(与df_database中的数据进行比较)发生了更改的位置,并将结果保存在名为df_changes的新数据框中

df_changes的摘录如下所示(数据框显示为HTML表,因为尝试显示Jupyter Notebook中显示的数据):

enter image description here

股票代码和名称可能都已更改,或者只是其中之一。

我想要实现的是一个新的数据框,如下所示:

enter image description here

我无法弄清楚如何实现这一目标。有什么帮助吗?

1 个答案:

答案 0 :(得分:1)

IIUC

pd.melt(
    df1,
    id_vars=['unique_identifier', 'version'],
    value_vars=['ticker', 'name']
).set_index(['unique_identifier', 'variable', 'version']) \
    .value.unstack().reset_index()

enter image description here