在给定的数据集中,我需要将来自不同块的值相互相乘。
我想从for循环中的下一行访问数据,然后构建列表并在块值匹配时创建产品但是我到目前为止看到的示例并不是很有帮助。实际上,这些数据只是大数据的一部分,我需要对任何提供的解决方案进行一些解释,说明它是如何/为什么有效的。
So,for X(set) I have to multiply: 0.25*0.1*0.83 (since they belong to same block
block X_set
2480 0.25
2480 0.1
2480 0.083
2651 0.43
2651 0.11
2651 0.23
我的代码如下:
test_q = open("test_question.txt", "r+")
header = test_q.readline()
data_q = test_q.read().rstrip("\n")
product=1.0
value_list = []
row = data_q.split("\n")
for line in row:
block = line.split("\t")
X_list = block[1].split()
X_value = float(block[1])
value_list = value_list + X_list
product = product*X_value
print(value_list)
print(product)
结果是:
['0.25', '0.1', '0.083', '0.43', '0.11', '0.23']
2.2573925000000003e-05
但是,在我想要的印刷品中
['0.25', '0.1', '0.083']
0.0002075
['0.43', '0.11', '0.23']
0.010879
所以,我想从下一行访问索引值,以便for循环可以继续或中断。
我尝试使用从下一行访问块值:
for i in range(0, len(row)-1):
next_line = row[i+1]
如何改进此代码?
那么,如何在这个for循环中注入break和continue函数?
我不想对块使用固定值,因为这是一个长文件,块值会改变。
此外,具有相同块值的行可能不会彼此相邻。
此外,我不需要大熊猫的解决方案,因为这只是大文件的一部分,使用for-if-else循环进行独占挖掘。
提前多多谢谢!
答案 0 :(得分:3)
from collections import defaultdict
from functools import reduce
from operator import mul
res = defaultdict(list)
with open('file') as f:
for r in f:
k, v = r.split()
res[k].append(v)
for v in res.values():
print(v)
print(reduce(mul, (float(f) for f in v), 1))
你的问题是你必须检查每一行才能找到一个匹配,这将是一个痛苦。只是存储在一个字典中然后在结尾打印出结果会更容易。 (如果您关心订单,可以使用OrderedDict
)
在评论中编辑@ everestial007的问题:
res = defaultdict(lambda: 1.0)
with open('file') as f:
for r in f:
k, v = r.split()
res[k] *= float(v)
for k, v in res.items():
res[k] = [str(v)]