我有两个数据帧df1和df2,并且都具有一个名为ID
的列。有人可以帮我理解做子集之间的区别
new_df = df1[df1['ID'].isin(df2['ID'].unique())]
并通过操作进行子设置
import pandas
unique_id_df = pandas.DataFrame(df2['ID'].unique())
unique_id_df.columns = ['ID']
new_df = df1.merge(unique_id_df,
on='ID',
how='inner')
我知道这两种方法之间存在一定的速度差异,并且行的顺序是不同的。但是返回的new_df
的形状相同。 new_df
是否包含相同的信息?