Question

我只是不知道如何解释我的需求。我不是在寻找任何代码，而只是教程和指导，以到达所需的位置。

示例：我在一个csv文件中有数字，a和b在不同的列中：

header1,header2
a,b
a1,b1
a2,b2
a3,b3
a4,b4
a5,b5
a6,b6

那么我将如何创建

[a(b)+a1(b1)+a2(b2)...a6(b6)] /(divided by) [sum of (all b values)]

好的，所以我知道如何使用熊猫编码分母，但是如何编码分子？

此过程称为什么，在哪里可以找到它的教程？

Answer 1

我不知道这是否是最好的方法，但应该可以。您可以在熊猫中创建一个由a * b

生成的新列

__gte

然后您可以简单地使用df['product'] = df['a']*df['b']来获取列b和列乘积的总和，然后将乘积除以b：

sum()

Answer 2

不确定这是否是最好的方法，但是您可以将列表推导与zip()函数一起使用。通过这两个，您可以像这样获得提名者：

[a*b for a, b in zip(df['header1'], df['header2'])]

Dive into Python 3具有更多的列表理解能力。 Here是zip()和here的文档，提供了一些用法示例。