我只是不知道如何解释我的需求。我不是在寻找任何代码,而只是教程和指导,以到达所需的位置。
示例:我在一个csv文件中有数字,a和b在不同的列中:
header1,header2
a,b
a1,b1
a2,b2
a3,b3
a4,b4
a5,b5
a6,b6
那么我将如何创建
[a(b)+a1(b1)+a2(b2)...a6(b6)] /(divided by) [sum of (all b values)]
好的,所以我知道如何使用熊猫编码分母,但是如何编码分子?
此过程称为什么,在哪里可以找到它的教程?
答案 0 :(得分:2)
我不知道这是否是最好的方法,但应该可以。您可以在熊猫中创建一个由a * b
生成的新列__gte
然后您可以简单地使用df['product'] = df['a']*df['b']
来获取列b和列乘积的总和,然后将乘积除以b:
sum()
答案 1 :(得分:1)
不确定这是否是最好的方法,但是您可以将列表推导与zip()
函数一起使用。通过这两个,您可以像这样获得提名者:
[a*b for a, b in zip(df['header1'], df['header2'])]
Chapter 3中的 Dive into Python 3具有更多的列表理解能力。 Here是zip()
和here的文档,提供了一些用法示例。