如何在现有数据框中添加新列,并用另一列中的部分数据填充它?

时间:2019-11-20 01:31:55

标签: python pandas dataframe

我有一个数据框职位 screenshot of dataframe

我需要在工作数据框中添加新的列“年”。该列应包含每个post_date的相应年份(已经是一列)。例如:对于post_date值2017-08-16,“年”值应为2017。

我不确定如何插入新列,同时还从现有列中提取数据。

2 个答案:

答案 0 :(得分:1)

我将从将post_date列转换为日期格式开始。完成此操作后,您可以使用一个简单的函数来提取年份。

jobs["post_date"] =pd.to_datetime(jobs["post_date"])

应该足以将其更改为日期时间类型。如果不是,则应该使用datetime strpstring来告诉python“ post_date”列的特定格式是什么,因此它将其读取为日期。之后,请执行以下操作:

jobs["year"] =jobs["post_date"].dt.year

答案 1 :(得分:0)

如果我正确理解了您的问题,则希望从当前数据框中的一列向现有数据框中添加新的年份值列。 仅提取年份值,您需要首先进行一些计算。您可以使用熊猫datetime.datetime并仅在Post_date列中提取年份的值。看一下thisthis。 要存储这些年份值,只需执行以下操作:

jobs['year'] = jobs['post_date'].dt.year