我有一个以下列方式构建的数据文件:
source_id,target_id,展示次数,点击次数
我在其上添加以下列:
下限/上限是计算值(它与我的问题无关,但对于好奇的these are the bounds for the Wilson confidence interval。
问题是,我正在尝试按下限(位置= 6)对列表进行排序,降序。尝试了几件事(排序/排序,使用lambda与使用itemgetter,创建一个没有标题的新列表并尝试对其进行排序)仍然没有任何变化。我有以下代码。
import csv
from math import sqrt
from operator import itemgetter
#----- Read CSV ----------------------------------------------------------------
raw_data_csv = open('rawdile', "rb")
raw_reader = csv.reader(raw_data_csv)
# transform the values to ints.
raw_data = []
for rownum,row in enumerate(list(raw_reader)):
if rownum == 0: # Header
raw_data.append(row)
else:
r = [] # Col header
r.extend([int(x) for x in row]) # Transforming the values to ints
raw_data.append(r)
# Add cols for pairs (as tuple) and CTR
raw_data[0].append("pair")
for row in raw_data[1:]:
row.append((row[0],row[1])) # tuple
# row.append(float(row[3])/row[2]) # CTR
# ------------------------------------------------------------------------------
z = 1.95996398454005
def confidence(n, clicks):
if n == 0:
return 0
phat = float(clicks) / n
l_bound = ((phat + z*z/(2*n) - z * sqrt((phat*(1-phat)+z*z/(4*n))/n))/(1+z*z/n)) # lower bound
u_bound = ((phat + z*z/(2*n) + z * sqrt((phat*(1-phat)+z*z/(4*n))/n))/(1+z*z/n)) # upper bound
return phat, l_bound, u_bound
raw_data[0].extend(["CTR","Lower Bound","Upper Bound"])
for row in raw_data[1:]:
phat, l_bound, u_bound = confidence(row[2],row[3])
row.extend([phat, l_bound, u_bound])
# raw_data[1:].sort(key=lambda x: x[6], reverse=True)
sorted(raw_data[1:], key=itemgetter(6), reverse=True)
outputfile= open('outputfile.csv', 'wb')
wr = csv.writer(outputfile,quoting = csv.QUOTE_ALL)
wr.writerows(raw_data)
raw_data_csv.close()
outputfile.close()
有人可以说明原因吗? 谢谢!
答案 0 :(得分:2)
您正在一次性排序切片(创建一个新的列表对象),而在另一次尝试中,您忽略了sorted()
的返回值。
你无法对列表中的部分内容进行排序;通过连接来创建一个新列表:
rows = rows[:1] + sorted(raw_data[1:], key=itemgetter(6), reverse=True)