我从3个值的差值产生平均值,并希望将其放在列表中
我想要平均的列表示例如下:
...
[6.0, 270.0, -55.845848680633168],
[6.0, 315.0, -47.572000492889323],
[6.5, 0.0, -47.806802767243724],
[6.5, 45.0, -48.511643275159528],
[6.5, 90.0, -45.002053150122123],
[6.5, 135.0, -51.034656702050455],
[6.5, 180.0, -53.266356523649002],
[6.5, 225.0, -47.872632929518339],
[6.5, 270.0, -52.09662072002746],
[6.5, 315.0, -48.563996448937075]]
最多有3行,其中前2列匹配(这2列是极坐标),在这种情况下,我想取第3个元素之间的差异,平均它并附加极坐标将平均结果指向新列表
for a in avg_data:
comparison = []
for b in avg_data:
if a[0] == b[0] and a[1] == b[1]:
comparison.append(b[2])
print comparison
z = 0 # reset z to 0, z does not need set now in if len(comp) == 1
if len(comparison) == 2: # if there are only 2 elements, compare them
z += -(comparison[0]) + comparison[1]
if len(comparison) == 3: # if all 3 elements are there, compare all 3
z += -(comparison[0]) + comparison[1]
z += -(comparison[0]) + comparison[2]
z += -(comparison[1]) + comparison[2]
z = z/3 #average the variation
avg_variation.append([a[0], a[1], z]) #append the polar coordinates and the averaged variation to a list
此代码将正确的数据输出到列表中,除非每次遇到匹配的极坐标时输出它,所以我最终得到重复的行。
为了阻止这种情况,我尝试在再次执行平均之前尝试实现if语句以在avg_variation列表中查找匹配的极坐标
if a[0] not in avg_variation and a[1] not in avg_variation:
这不起作用,我收到错误
ValueError: The truth value of an array with more than one element is ambiguous. Use a.any() or a.all()
我不认为我正在寻找任何或所有内容,因为我只想检查前两列而不是第三列对已经附加的值。任何人都知道如何让我的if语句变得更好?
进一步澄清我的实际问题:
我的代码在嵌套列表中搜索前2个元素匹配的列表,对第3个元素执行计算,然后将它们附加到新列表。我的问题是,如果有2行或3行匹配前2个元素,它会将结果附加到新列表2或3次,我希望它只执行一次
编辑:抱歉,我的原始问题误导了我的代码的目的。
答案 0 :(得分:3)
IIUC,我认为更简单的方法就像
import numpy as np
from itertools import combinations
from collections import defaultdict
def average_difference(seq):
return np.mean([j-i for i,j in combinations(seq, 2)]) if len(seq) > 1 else 0
def average_over_xy(seq, fn_to_apply):
d = defaultdict(list)
for x,y,z in seq:
d[x,y].append(z)
outlist = [[x,y,fn_to_apply(z)] for (x,y),z in sorted(d.items())]
return outlist
循环遍历所有行,生成一个字典,其中x,y坐标是键和元素的值列表,然后将该字典转换为排序的列表列表,在{中的元素之间应用指定的函数{1}}。例如,我们可以使用平均有符号和有序差异,就像在您的代码中一样:
产生
z
请注意,你已经定义它的方式,我在上面的匹配,答案取决于元素的给定顺序,即
>>> seq = [[1, 2, 30], [1, 2, 40], [1, 2, 50], [1, 3, 4], [1, 3, 6], [2, 10, 5]]
>>> average_over_xy(seq, average_difference)
[[1, 2, 13.333333333333334], [1, 3, 2.0], [2, 10, 0]]
如果您愿意,可以使用
>>> average_over_xy([[1,2,3],[1,2,4]], average_difference)
[[1, 2, 1.0]]
>>> average_over_xy([[1,2,4],[1,2,3]], average_difference)
[[1, 2, -1.0]]
代替或使用标准偏差或任何你喜欢的。 (你没有提到你的用例,所以我假设你按照你想要的顺序得到了列表,你知道了陷阱,你真的需要def average_difference_sorted(seq):
return average_difference(sorted(seq))
)。
我们可以做一些基于average_difference
的更快的技巧,以及推广它的方法,但使用numpy
来累积值是一种方便的模式,而且通常足够快。
答案 1 :(得分:1)
这是一个可能的解决方案:
l=[[6.0, 270.0, -55.845848680633168],
[6.0, 315.0, -47.572000492889323],
[6.5, 0.0, -47.806802767243724],
[6.0, 180.0, -53.266356523649002],
[6.0, 225.0, -47.872632929518339],
[6.0, 270.0, -52.09662072002746],
[6.0, 315.0, -48.563996448937075]]
# First, we change the structure so that the pair of coordinates
# becomes a tuple which can be used as dictionary key
l=[[(c1, c2), val] for c1, c2, val in l]
# We build a dictionary coord:[...list of values...]
d={}
for coord, val in l:
d.setdefault(coord,[]).append(val)
# Here, I compute the mean of each list of values.
# Apply your own function !
means = [[coord[0], coord[1], sum(vals)/len(vals)] for coord, vals in d.items()]
print means
答案 2 :(得分:0)
您没有提供确保这一点所需的所有信息,但我相信您的错误是由对numpy数组执行逻辑操作引起的。请参阅this answer以查找类似错误的问题。
如果没有更多信息,很难复制你的问题的上下文来尝试它,但是在if
语句中的布尔操作中更具体可能会有所帮助。