我有一个像这样的列表列表:
list = [[year1-month1,int1,float1],[year1-month1,int2,float2],[year1-month2,int3,float3]....
我需要定义一个通过它的函数返回如下结果:
newList = [[((int1*float1)+(int2*float2))/(float1+float2),year-month1],...
我的问题是超过2000个子列表中的第一项是一个年月格式的日期,其余的是几天的值,我需要得到月平均值。我尝试过很少的东西,却无法让它发挥作用。我会很感激一些建议。
我尝试过的是:
def avPrice(mylist):
month=[]
i = 0
for i in mylist:
if mylist[i][0] not in month:
month = mylist[i][0],mylist[i][1]*mylist[i][2],mylist[i][2]
else:
month = month[0],month[1]+(mylist[i][1]*mylist[line][2]),month[2]+mylist[i][2]
i = i + 1
return month
monthAvPrice.append(month)
答案 0 :(得分:2)
使用itertools.groupby()将条目组合在一起一个月,使用reduce()组合数字。例如:
import itertools
ddat= [['2012-01', 1, 5.4], ['2012-01', 2, 8.1], ['2012-01', 3, 10.8],
['2012-01', 4, 13.5], ['2012-02', 1, 8.1], ['2012-02', 2,10.8],
['2012-02', 3, 13.5], ['2012-02', 4, 16.2], ['2012-03', 1, 10.8],
['2012-03', 2, 13.5], ['2012-03', 3, 16.2], ['2012-03', 4, 18.9],
['2012-04', 1, 13.5], ['2012-04', 2, 16.2], ['2012-04', 3,18.9]]
[[w[0], reduce(lambda x, y: x+y[1]*y[2], list(w[1]), 0)] for w in itertools.groupby(ddat, key=lambda x:x[0])]
产生
[['2012-01', 108.0],
['2012-02', 135.0],
['2012-03', 162.0],
['2012-04', 102.6]]
编辑:以上只获取所需值的分子。下面显示的代码计算分子和分母。作为演示代码,它会生成一个包含值及其比率的列表。
请注意以下代码中明显额外的for
。 (即,部分
... for w,v in [[w, list(v)] for w,v in itertools ...
在第三行代码中。)for
的额外层用于将可迭代v
的副本作为列表。也就是说,因为itertools.groupby()返回的v
是可迭代的而不是实际的列表,numer_sum(v)
会耗尽v
,所以denom_sum(v)
会得到一个值另一种方法是使用itertools.tee;但an answer另一个问题是list
方法可能更快。第三种可能性是将numer_sum
和denom_sum
合并为一个返回元组的函数,并添加一个外部for
来计算比率。
def numer_sum(w): return reduce(lambda x,y: x+y[1]*y[2], w, 0)
def denom_sum(w): return reduce(lambda x,y: x+y[2], w, 0)
[[w, round(denom_sum(v),3), numer_sum(v), numer_sum(v)/denom_sum(v)] for w,v in [[w, list(v)] for w,v in itertools.groupby(ddat, key=lambda x:x[0])]]
产生
[['2012-01', 37.8, 108.0, 2.857142857142857],
['2012-02', 48.6, 135.0, 2.777777777777778],
['2012-03', 59.4, 162.0, 2.7272727272727275],
['2012-04', 48.6, 102.6, 2.111111111111111]]
答案 1 :(得分:1)
这就是我想出来的。
def appendDateNumbers(d, item):
def sumItem(date, integer, floating, *junk):
if date in d:
d[date]+=integer*floating
else:
d[date]=integer*floating
return d
return sumItem(*item)
def _averageListWith(dn, datesList):
def averageItem(i):
return (i, dn[i]/datesList.count(i))
return dict(map(averageItem, dn.keys()))
def averageLst(lst):
return _averageListWith(reduce(appendDateNumbers, lst, {}),
map(lambda x: x[0], lst))
print averageLst([["12-12", 1, 1.0],["12-12", 2, 2.2],["13-1", 3, 3.3]])
averageLst()函数应该为你加上或减去舍入误差。
答案 2 :(得分:0)
我知道可能有更好的方法,但你尝试过使用for循环吗?
def monthly_average(list):
newList=[]
for i in range(len(list)/2):
avg=((list[i][1]*list[i][2])+(list[i+1][1]+list[i+1][2]))
avg=avg/(list[i][2]+list[i+1][2])
newList.append(avg)
newList.append(list[i][0])
return newList
假设每个月有两个子列表,那应该可行。如果你有更多,那么你可能需要添加一个函数来检查所有“零”索引等于某个字符串的子列表。例如:
newList=[]
tempList=[]
for i in list:
if i[0]=='year1-month1':
tempList.append(i)
while len(tempList)>1:
tempList=monthly_average(tempList)
然后只需每月迭代一次,更改字符串值。
同样,它可能不是最有效的方法,但它有效。