我有一套四重奏('myTup')和一个元组('tupleToSearch')。我需要在每个四元组中搜索这个元组的所有实例。 'tupleToSearch'将比较每个四元组的前两个元素,如果匹配则会报告匹配四元组的最后两个元素。
我使用以下代码执行相同操作。
myTup = set([('0994900', '50.2297', 'name1', '<4'),
('2176041', '24.2880', 'name2', 'POSITIVE'),
('2240663', '51.2510', 'name3', '25.0'),
('2240663', '51.2510', 'name4', '29.0'),
('2240663', '51.2560', 'name4', '29.0')])
tupToSearch = ('2240663', '51.2510')
[(x[2],x[3]) for x in myTup if tupToSearch == (x[0],x[1])]
我需要扩展此代码,以便不进行精确搜索,而是对范围进行比较。
例如,给定tupleToSearch = ('2240663', '51.2510')
,我想找到那些第二个元素是> = 51.2510但小于(51.2510 +偏移)的四元组。这里'offset'是一个常数。
上述案例中的正确答案将报告最后三个四元组(仅来自其中每个元素的最后两个元素)。
如何将第二个元素转换为数值以进行正确比较。
此外,我需要一种有效的方法来实现这一点,因为我需要重复这一步骤近十亿次。
答案 0 :(得分:0)
过滤掉您想要的元素,然后拉出每个元素的块以创建结果。
[(el[2], float(el[3])) for el in itertools.ifilter(lambda oel: oel[0] == search_tup[0] and float(search_tup[1]) <= float(oel[1]) <= float(search_tup[1]) + offset, my_tup)]
或者,使用生成器在一次通过中完成整个操作(请注意,与list comp不同,生成器将优雅地处理el[3]
无法转换为浮点数的情况。)
def filtered_data(input, search_target, offset):
key = search_target[0]
value = float(search_target[1])
for entry in input:
entry_value = float(entry[1])
if entry[0] == key and entry_value <= value <= entry_value + offset:
try:
result_value = float(entry[3])
except ValueError:
result_value = entry[3]
yield (entry[2], result_value)
[filtered_data(my_tup, search_tup, .019)]
请注意,由于您在此处使用浮点值,因此当浮点十进制值转换为浮点二进制值时,您的过滤过程将始终受到无误的不准确性的影响。因此,您可能希望使用Decimal
或在基值中建立偏移量。
答案 1 :(得分:0)
嗯,有float function,可以用来编写这段代码:
low_target = float(tupToSearch[1])
high_target = low_target + constant
[(x[2],x[3]) for x in myTup if low_target<=float(x[1])<=high_target]