我有一个很大的数字列表,我想知道它们中的任何一个是否大致相等。如果2个数字“大致相等”(为了我的目的),它们都在彼此的10%之内(参见下面的2个例子。)然后我想把它们分成大致相等数字的单独列表。
示例#1 比较5.0和5.5: 5.5 +/- 10%= 4.95到6.05(5.0在此范围内) 5.0 +/- 10%= 4.50到5.50(并且5.5在此范围内) 因此,5.0和5.5大致相等。
示例#2 比较5.0和5.6: 5.6 +/- 10%= 5.04到6.16(5.0在此范围内) 5.0 +/- 10%= 4.50到5.50(5.6不在此范围内) 因此,5.0和5.6并不大致相等。
我需要做的总结: 输入= {4.0,4.1,4.2,4.0,9.0,9.4,8.9,4.3} 期望输出= {4.0,4.1,4.2,4.0,4.3}和{9.0,9.4,8.9}
答案 0 :(得分:3)
input_list = [4.0, 4.1, 4.2, 4.0, 9.0, 9.4, 8.9, 4.3]
results = {input_list[0]: [input_list[0]]} # Start with first value
for value in input_list[1:]: # loop through our entire list after first value
hi = value * 1.1
low = value * 0.9
print("Value: {0}\tHi: {1}\tLow:{2}".format(value, hi, low))
for existing in results: # search through our result set
found_similar = False
if low < existing < hi: # if we find a match
results[existing].append(value) # we add our value to the list for that set
found_similar = True
break
if not found_similar: # if we looped through our entire results without a match
results[value] = [value] # Create a new entry in our results dictionary
for entry in results:
print(results[entry])
会给:
results = { 9.0: [9.0, 9.4, 8.9],
4.0: [4.0, 4.1, 4.2, 4.0, 4.3] }
此代码以列表中的第一个值开头,并查找在该列表的10%范围内的所有后续值。因此,在您的示例中,它以4开头,并查找所有类似的值。任何不在10%以内的值都会添加到新的“集合”中。
因此,一旦达到9.0,它就会发现它不匹配,因此它会将新结果集添加到results
字典,其密钥为9.0
。现在当它考虑9.4时,它在4.0列表中找不到匹配,但它 在9.0列表中找到匹配。因此,它将此值添加到第二个结果集。
答案 1 :(得分:0)
这是一个基于生成器/集的方法。
def set_gen(nums):
for seed in sorted(nums):
yield tuple([n for n in nums if seed <= n and n/seed <= 1.1])
def remove_subsets(sets):
for s in sets.copy():
[sets.remove(s2) for s2 in sets.difference([s]) if set(s2).issubset(s)]
>>> nums = [4.0, 4.1, 4.2, 4.0, 9.0, 9.4, 8.9, 4.3]
>>> x = set(num for num in set_gen(nums))
>>> remove_subsets(x)
>>> list(x)
[(9.0, 9.4, 8.9), (4.0, 4.1, 4.2, 4.0, 4.3)]
>>> nums = [1.0, 1.1, 1.2, 1.3, 1.4, 1.5, 1.6, 1.7, 1.8, 1.9, 2.0]
>>> x = set(num for num in set_gen(nums))
>>> remove_subsets(x)
>>> list(x)
[(1.9, 1.8), (1.5, 1.4), (1.4, 1.3), (1.2, 1.1), (1.7, 1.6), (1.5, 1.6), (1.3, 1.2), (1.9, 2.0), (1.0, 1.1), (1.8, 1.7)]
答案 2 :(得分:-1)
你可以这样做:
Input = {4.0, 4.1, 4.2, 4.0, 9.0, 9.4, 8.9, 4.3}
wl=sorted(Input,reverse=True)
apr=.1
out={}
while wl:
wn=wl.pop()
out[wn]=[wn]
while wl and wl[-1]<=wn*(1+apr):
out[wn].append(wl.pop())
print [(k,out[k]) for k in sorted(out.keys())]
打印:
[(4.0, [4.0, 4.1, 4.2, 4.3]), (8.9, [8.9, 9.0, 9.4])]
在评论中尝试这个例子:
>>> Input = {1.0, 1.1, 1.2, 1.3, 1.4, 1.5, 1.6, 1.7, 1.8, 1.9, 2.0}
打印:
[(1.0, [1.0, 1.1]), (1.2, [1.2, 1.3]), (1.4, [1.4, 1.5]), (1.6, [1.6, 1.7]), (1.8, [1.8, 1.9]), (2.0, [2.0])]