熊猫-将列表添加到多列(用于多行)

时间:2018-06-26 01:57:30

标签: python pandas

我有一个要更新为多列的值列表,这对于单行来说很好。但是,当我尝试更新多行时,它只会用最后一个值覆盖整个列。

每行的列表如下所示(注意:列表长度可变):

['2016-03-16T09:53:05',
 '2016-03-16T16:13:33',
 '2016-03-17T13:30:31',
 '2016-03-17T13:39:09',
 '2016-03-17T16:59:01',
 '2016-03-23T12:20:47',
 '2016-03-23T13:22:58',
 '2016-03-29T17:26:26',
 '2016-03-30T09:08:17']

我可以使用以下方法将其存储在空列中:

for i in range(len(trans_dates)):
    df[('T' + str(i + 1) + ' - Date')] = trans_dates[i]

但是,这会使用单个trans_dates[i]值更新整个列

我认为使用上面的代码遍历每一行都可以,但是仍然会覆盖。

for issues in all_issues:
    for i in range(len(trans_dates)):
        df[('T' + str(i + 1) + ' - Date')] = trans_dates[i]
  • 如何只更新循环中的当前行?
  • 我什至会以正确的方式这样做吗?还是有更快的矢量化方法?

下面的完整代码段:

for issues in all_issues:
    print(issues)
    changelog = issues.changelog
    trans_dates = []
    from_status = []
    to_status = []
    for history in changelog.histories:
        for item in history.items:
            if item.field == 'status':
                trans_dates.append(history.created[:19])
                from_status.append(item.fromString)
                to_status.append(item.toString)
    trans_dates = list(reversed(trans_dates))
    from_status = list(reversed(from_status))
    to_status = list(reversed(to_status))
    print(trans_dates)

    # Store raw data in created columns and convert dates to pd.to_datetime
    for i in range(len(trans_dates)):
        df[('T' + str(i + 1) + ' - Date')] = trans_dates[i]
    for i in range(len(to_status)):
        df[('T' + str(i + 1) + ' - To')] = to_status[i]
    for i in range(len(from_status)):
        df[('T' + str(i + 1) + ' - From')] = from_status[i]
    for i in range(len(trans_dates)):
        df['T' + str(i + 1) + ' - Date'] = pd.to_datetime(df['T' + str(i + 1) + ' - Date'])
  • 编辑:添加了示例输入和输出。

输入: 第1行/第1列(注意年份更改):

    ['2016-03-16T09:53:05',
     '2016-03-16T16:13:33',
     '2016-03-17T13:30:31',
     '2016-03-17T13:39:09']

第2个问题

['2017-03-16T09:53:05',
 '2017-03-16T16:13:33',
 '2017-03-17T13:30:31']

第3个问题

['2018-03-16T09:53:05',
 '2018-03-16T16:13:33',
 '2018-03-17T13:30:31']

第4个问题

['2015-03-16T09:53:05',
 '2015-03-16T16:13:33']

输出:

        col       T1                     T2                      T3                 T4
        17 '2016-03-16T09:53:05'   '2016-03-16T16:13:33'  '2016-03-17T13:30:31'  '2016-03-17T13:30:31'
        18 '2017-03-16T09:53:05'   '2017-03-16T16:13:33'  '2017-03-17T13:30:31'  np.nan
        19 '2018-03-16T09:53:05'   '2018-03-16T16:13:33'  '2018-03-17T13:30:31' np.nan
        20 '2015-03-16T09:53:05'   '2015-03-16T16:13:33'      np.nan     np.nan

1 个答案:

答案 0 :(得分:1)

代替此:

for i in range(len(trans_dates)):
    df[('T' + str(i + 1) + ' - Date')] = trans_dates[i]

尝试一下:

for i in range(len(trans_dates)):
    df.loc[i, ('T' + str(i + 1) + ' - Date')] = trans_dates[i]  

可能有更好的方法来执行此操作……df.mergedf.replace……如果发布输入数据框的外观和预期结果,将很有帮助。