我尝试将某些数字离散化,看看它们是否在给定范围内,然后根据范围分配一个数字,但是我得到的结果并不完全正确。
mapp
是一个字典,用于定义范围,以及与给定范围对应的值。
lst
是我想要与这些范围匹配的数字列表,并为其分配标识符
mapp = {(0,100): 1, (100,400): 2, (400,800): 3}
lst = [3.5, 5.4, 300.12, 500.78, 600.45, 900.546]
def discretize(mapping_dict, list_of_values):
print "\n"
location = []
for x in sorted(list_of_values):
for (lower_bound,upper_bound),value in mapping_dict.items():
if round(x) in range(lower_bound,upper_bound):
print round(x), "yes", value
distance = mapping_dict[(lower_bound,upper_bound)]
location.append((distance))
else:
print round(x), "no"
distance = len(mapping_dict.items())+10
location.append((distance))
return location
我期望的结果是:[1, 1, 2, 3, 3, 13]
,但这不是我得到的。
这是我得到的实际结果,这是不正确的:
4.0 yes 1
4.0 no #wrong!
5.0 yes 1
5.0 no #wrong!
300.0 yes 2
300.0 no #wrong!
501.0 yes 3
501.0 no #wrong!
600.0 yes 3
600.0 no #wrong!
901.0 no #CORRECT
[1, 13, 1, 13, 2, 13, 3, 13, 3, 13, 13]
我在no
4.0
得到{{1}}这是不正确的等等。
问题出在哪里?
由于
答案 0 :(得分:3)
mapp = {(0,100): 1, (100,400): 2, (400,800): 3}
lst = [3.5, 5.4, 300.12, 500.78, 600.45, 900.546]
result = []
for l in lst:
for m in mapp:
if m[0] < l < m[1]:
result.append(mapp[m])
print result
输出:
[1, 1, 2, 3, 3]
编辑:
result = []
for l in lst:
flag=True
for m in mapp:
if m[0] < l < m[1]:
result.append(mapp[m])
flag = False
break
if flag:
result.append(-1)
print result
输出:
[1, 1, 2, 3, 3, -1]
答案 1 :(得分:1)
在else
循环之后放置for
,您就是正确的轨道!当您放置else
after a loop时,每次循环正常退出时都会执行else
块,即不使用例如break
。因此,(假设您的群组不重叠),您只需在break
块的末尾添加if
语句,即location.append((distance))
之后。然后它按预期工作。
此外,您应该只使用range
和<=
,而不是检查该号码是否在<
(每次创建并搜索列表!)中。此外,您已经拥有value
,为什么不使用它?
for (lower_bound, upper_bound), value in mapping_dict.items():
if lower_bound <= x < upper_bound:
location.append(value)
break
else:
location.append(len(mapping_dict) + 10)
答案 2 :(得分:1)
我想我曾经遇到过类似的问题,因为我发现了一个小RangeDict
类:
class RangeDict (dict):
def __init__ (self, *args):
super ().__init__ ()
def __setitem__ (self, k, v):
if not isinstance (k, slice): raise ValueError ('Indices must be slices.')
super ().__setitem__ ( (k.start, k.stop), v)
def __getitem__ (self, k):
for (start, stop), v in self.items ():
if start <= k < stop: return v
raise IndexError ('{} out of bounds.'.format (k) )
我希望这个课程包含你想要的功能。显然查找是O(N)而不是O(1)。
样本用法:
r = RangeDict ()
r [0:100] = 1
r [100:400] = 2
r [400:800] = 3
for x in [3.5, 5.4, 300.12, 500.78, 600.45, 900.546]:
print (r [x] )
#Last value raises IndexError