使用熊猫匹配数据集1中的2列以获取数据集2中的最新匹配项

时间:2020-06-23 15:11:11

标签: python pandas

我有一张桌子,其中包含今天的足球比赛:

{ 'ORAMECI': ['1800',
  '1800',
  '1800',
  '1830',
  '2045',
  '1830',
  '1730',
  '1930',
  '1730',
  '1800',
  '1830',
  '1930',
  '2045',
  '1730',
  '2045',
  '1830',
  '1730',
  '1730',
  '1800',
  '1800',
  '2115',
  '1800',
  '1730',
  '2015',
  '1800',
  '2100',
  '1900',
  '1930',
  '1830',
  '1830',
  '1755',
  '1915',
  '2005'],
 'TXTECHIPA1': ['Orgryte Goteborg',
  'Trelleborgs',
  'Dalkurd',
  'Elche',
  'Extremadura',
  'Lugo',
  'Juniors OO',
  'Cologne',
  'Klagenfurt',
  'Uerdingen',
  'Spal',
  'Thun',
  'FC Torino',
  'Horn',
  'Genoa',
  'Verona',
  'Dornbirn',
  'Linz',
  'Chemnitz',
  'Leicester',
  'Porto',
  'Jonkopings',
  'HB Koege',
  'Tottenham',
  'Fredericia',
  'Barcelona',
  'Setubal',
  'Rostock',
  'Valladolid',
  'Levante',
  'Fehervar',
  'Benfica',
  'Ujpest'],
 'TXTECHIPA2': ['Halmstad',
  'Osters',
  'Eskilstuna',
  'La Coruna',
  'Zaragoza',
  'Malaga',
  'Ried',
  'Duisburg',
  'Graz',
  'Wurzburg',
  'Cagliari',
  'Young Boys Bern',
  'Udinese',
  'Lafnitz',
  'Parma Calcio',
  'Napoli',
  'Floridsdorf',
  'Lustenau',
  'Braunschweig',
  'Brighton',
  'Boavista FC',
  'Ljungskile',
  'Kolding IF',
  'West Ham',
  'Vendsyssel',
  'Bilbao',
  'Rio Ave',
  'Kaiserslautern',
  'Getafe',
  'Atletico',
  'Ferencvarosi',
  'Santa Clara',
  'Zalaegerszeg']}

我想要做的是在另一张桌子上循环,以获取这两支球队上一次比赛得分的时间。 (最后H2H)

我将所有比赛存储在数据库中,所以我认为最好是将所有联赛的最近3年比赛都存储在数据集中。

lastyear = pd.read_sql('SELECT * FROM db WHERE DATAMECI >= DATE_SUB(NOW(),INTERVAL 3 YEAR) ORDER BY DATAMECI desc ', con=db_connection)

列名与我从同一数据库中提取“今天的比赛”完全相同,我需要添加的额外列是“ SCOR1”和“ SCOR2”

我想我能做的是遍历今天比赛的每一行,并尝试找到这两支球队上场比赛的最后一场比赛,并在“今日比赛”中创建SCORE1和SCORE2的新列

for index, row in df_clean.iterrows():
    df_clean['SCORE1 '] = ??
    df_clean['SCORE1 '] = ??

这是我被困住的地方,因为我只需要选择到达的最前面的比赛即可。

我什至是最好的方式吗?

0 个答案:

没有答案