Pandas:创建/设置子集或行和列的简洁方法(使用MultiIndex)

时间:2018-01-18 17:33:33

标签: python pandas

假设有一个数据帧

df = pd.DataFrame(np.arange(24).reshape(4, 6), 
                  columns=pd.MultiIndex.from_product([list('ab'), range(3)]),
                  index=pd.MultiIndex.from_product([list('xy'), range(2)]))

enter image description here

我希望创建3个新列('c', 0), ('c', 1), ('c', 2)并仅在索引('x', 0), ('x', 1)

分配值

我想得到的结果应该是这样的

enter image description here

不幸的是,像这样编写它并不起作用

df.loc['x', 'c'] = np.arange(6).reshape(2, 3)

# or

df.loc['x', [('c', 0), ('c', 1), ('c', 2)]] = np.arange(6).reshape(2, 3) + 100

虽然如果我尝试只分配一个新列,它可以工作:

df.loc['x', ('c', 0)] = np.arange(2).reshape(2, 1) + 100

我可能可以使用pd.concat编写并使用对齐的indexcolumns创建新的数据框,但我正在寻找更简洁的方法。

谢谢!

2 个答案:

答案 0 :(得分:1)

您可以先定义列

if request.method == 'POST':
        form = forms.FormName(request.POST)

        if form.is_valid():
            contact_name = request.POST.get(
                'name', '')
            contact_email = request.POST.get(
                'email', '')
            form_content = request.POST.get('contactmessage', '')

            template = get_template('contact_template.txt')
            context = {'name': contact_name,
            'email': contact_email,
            'contactmessage': form_content,}
            content = template.render(context)
            mail = EmailMessage("New contact form submission", content, "Some Name" +'', ['somegmail@gmail.com'],
            headers = {'Reply-To': "noreply@gmail.com" })
            mail.send()
    return render(request, 'index.html', {'form': form})

然后分配值

for id in range(3): df[('c', id)] = None
OP指出

或者指定它们更简单,

df.loc['x', [('c', 0), ('c', 1), ('c', 2)]] = np.arange(6).reshape(2, 3) + 100

答案 1 :(得分:1)

您的问题是,您要将值分配给一次不存在的多个列。您可以通过重新索引数据框来首先添加这些列。

new_col = pd.MultiIndex.from_tuples([("c", 0), ("c", 1), ("c", 2)])
existing_col = df.columns
df = df.reindex(existing_col.append(new_col), axis=1)
# now you can do what you want.
df.loc['x', 'c'] = np.arange(6).reshape(2, 3) + 100

我认为loc只允许您一次放大一个键(列名)。因此,即使df.loc['x', ('c', 0)] = np.arange(2).reshape(2, 1) + 100可行。分配到3列将失败。您可以在Pandas- set values to an empty dataframe

上查看我的回答