我正在将两个数据帧合并到两个数据帧中均为float64的列上。但是,合并后的数据帧的所有列的NaN都来自两个数据帧之一。
这是合并:
merged_df = pd.merge(tweets_df, news_merged_df, on='tweet_id')
有关这两个数据框的信息
news_merged_df.info()
<class 'pandas.core.frame.DataFrame'>
Int64Index: 1777939 entries, 0 to 1777938
Data columns (total 6 columns):
tweet_id float64
news_id object
label bool
title object
source object
text object
dtypes: bool(1), float64(1), object(4)
tweets_df.info()
<class 'pandas.core.frame.DataFrame'>
RangeIndex: 1844156 entries, 0 to 1844155
Data columns (total 13 columns):
level_0 int64
index int64
tweet_id float64
tweet object
user_screen_name object
user_id object
user_location object
user_verified bool
user_friends_count int64
user_followers_count int64
user_listed_count int64
user_statuses_count int64
user_favourites_count int64
dtypes: bool(1), float64(1), int64(7), object(4)
我想念什么?