假设有一个数据帧
df = pd.DataFrame(np.arange(24).reshape(4, 6),
columns=pd.MultiIndex.from_product([list('ab'), range(3)]),
index=pd.MultiIndex.from_product([list('xy'), range(2)]))
我希望创建3个新列('c', 0), ('c', 1), ('c', 2)
并仅在索引('x', 0), ('x', 1)
我想得到的结果应该是这样的
不幸的是,像这样编写它并不起作用
df.loc['x', 'c'] = np.arange(6).reshape(2, 3)
# or
df.loc['x', [('c', 0), ('c', 1), ('c', 2)]] = np.arange(6).reshape(2, 3) + 100
虽然如果我尝试只分配一个新列,它可以工作:
df.loc['x', ('c', 0)] = np.arange(2).reshape(2, 1) + 100
我可能可以使用pd.concat
编写并使用对齐的index
和columns
创建新的数据框,但我正在寻找更简洁的方法。
谢谢!
答案 0 :(得分:1)
您可以先定义列
if request.method == 'POST':
form = forms.FormName(request.POST)
if form.is_valid():
contact_name = request.POST.get(
'name', '')
contact_email = request.POST.get(
'email', '')
form_content = request.POST.get('contactmessage', '')
template = get_template('contact_template.txt')
context = {'name': contact_name,
'email': contact_email,
'contactmessage': form_content,}
content = template.render(context)
mail = EmailMessage("New contact form submission", content, "Some Name" +'', ['somegmail@gmail.com'],
headers = {'Reply-To': "noreply@gmail.com" })
mail.send()
return render(request, 'index.html', {'form': form})
然后分配值
for id in range(3): df[('c', id)] = None
OP指出或者指定它们更简单,
df.loc['x', [('c', 0), ('c', 1), ('c', 2)]] = np.arange(6).reshape(2, 3) + 100
答案 1 :(得分:1)
您的问题是,您要将值分配给一次不存在的多个列。您可以通过重新索引数据框来首先添加这些列。
new_col = pd.MultiIndex.from_tuples([("c", 0), ("c", 1), ("c", 2)])
existing_col = df.columns
df = df.reindex(existing_col.append(new_col), axis=1)
# now you can do what you want.
df.loc['x', 'c'] = np.arange(6).reshape(2, 3) + 100
我认为loc
只允许您一次放大一个键(列名)。因此,即使df.loc['x', ('c', 0)] = np.arange(2).reshape(2, 1) + 100
可行。分配到3列将失败。您可以在Pandas- set values to an empty dataframe