Question

首先我们可以导入一些可能有用的包

import pandas as pd
import datetime

假设我现在有一个包含日期、姓名和年龄列的数据框。

df1 = pd.DataFrame({'date': ['10-04-2020', '04-07-2019', '12-05-2015' ], 'name': ['john', 'tim', 'sam'], 'age':[20, 22, 27]})

现在说我有另一个带有一些随机列的数据框

df2 = pd.DataFrame({'a': [1,2,3], 'b': [4,5,6]})

问题：

如何获取 df1 中按日期过滤的年龄值（可以选择此值）并使用此值填充 df2 中的全新列？理想情况下，此方法应该适用于数据框中的任意数量的行。

尝试过

以下是我尝试过的（在一个类似的例子中）但由于某种原因它似乎不起作用（它只在大多数列条目中显示 nan 值，除了一些似乎随机填充的值）。

y = datetime.datetime(2015, 5, 12)
df2['new'] = df1[(df1['date'] == y)].age

预期产出

由于我已经根据 sams 年龄（日期对应于具有 sams 名称的行）在上面进行了过滤，因此我希望将新列添加到 df2 中，并将他的年龄作为所有条目（在这种情况下 27 重复 3 次）。

df2 = pd.DataFrame({'a': [1,2,3], 'b': [4,5,6], 'new': [27, 27, 27]})

Answer 1

试试：

y = datetime.datetime(2015, 5, 12).strftime('%d-%m-%Y')
df2.loc[:, 'new'] = df1.loc[df1['date'] == y, "age"].item()

# Output
   a  b  new
0  1  4   27
1  2  5   27
2  3  6   27

Answer 2

您想将 y 的格式更改为 Str 并尝试使用 df.loc 方法

y = datetime.datetime(2015, 5, 12)

y=y.strftime('%d-%m-%Y')
df2['new']=int(df1.loc[df1['date']==y,'age'].values)
df2

Answer 3

将 df1 date 列转换为 datetime 类型

df1['date'] = pd.to_datetime(df1.date, format='%d-%m-%Y')

过滤数据框并获取年龄

req_date = '2015-05-12'
age_for_date = df1.query('date == @req_date').age.iloc[0]

注意：这假设每个日期只有一个年龄（正如 OP 在评论中所解释的那样）

创建一个新列

df2 = df2.assign(new=age_for_date)

输出

   a  b  new
0  1  4   27
1  2  5   27
2  3  6   27

如何使用另一个数据框列中的值填充熊猫数据框列

3 个答案: