哈希表中的CSV然后计算总和

时间:2015-11-30 21:40:49

标签: python python-2.7 csv hashtable

这是我的csv文件:

name;value
John;4.0
John;-15.0
John;1.0
John;-2.0
Bob;1.0
Bob;2.5
Bob;-8

我想打印此输出:

John : 22
Bob : 11,5

22因为4 + 15 + 1 + 2 = 22

11,5因为1 + 2,5 + 8 = 11,5

忽略-符号并使用正号计算总数非常重要。

我试过了:

import csv
with open('myfile.csv', 'rb') as f:
    reader = csv.reader(f, delimiter=';')
    for row in reader:
        print row
Hashtable = {}

我知道我必须使用带有键值系统的散列表,但是我已经陷入困境,请帮助我,我正在使用python 2.7。

3 个答案:

答案 0 :(得分:2)

假设11,5应为11.5,请使用defaultdict来处理重复的密钥,只需str.lstrip任何减号和+=每个值

import csv
from collections import defaultdict

d = defaultdict(float)
with open('test.txt', 'rb') as f:
    reader = csv.reader(f, delimiter=';')
    next(reader) # skip header
    for name, val in reader:
        d[name] += float(val.lstrip("-"))

输出:

for k,v in d.items():
    print(k,v)
('Bob', 11.5)
('John', 22.0)

如果您出于某种原因想要使用常规字典,可以使用dict.setdefault

d = {}
with open('test.txt', 'rb') as f:
    reader = csv.reader(f, delimiter=';')
    next(reader)
    for name, val in reader:
        d.setdefault(name, 0)
        d[name] += float(val.lstrip("-"))

使用defauldict和lstrip是最有效的,一些时间:

In [26]: timeit default()
100 loops, best of 3: 2.6 ms per loop

In [27]: timeit counter()
100 loops, best of 3: 3.98 ms per loop

答案 1 :(得分:2)

以下是如何调整代码以在最后输出哈希值:

import csv
out_hash = {}
with open('test.csv', 'rb') as f:
  reader = csv.reader(f, delimiter=';')
  reader.next() # Just to skip the header
  for row in reader:
    if row[0] in out_hash:
      out_hash[row[0]] += abs(float(row[1]))
    else:
      out_hash[row[0]] = abs(float(row[1]))
print out_hash

输出:

{'Bob': 11.5, 'John': 22.0}

答案 2 :(得分:1)

在这种情况下我会使用Counter,这是一个围绕字典的标准库包装器,允许您轻松计算元素。

import csv
from collections import Counter

counter = Counter()

with open('myfile.csv', 'rb') as f:
    reader = csv.reader(f, delimiter=';')
    reader.next() #skips the heading
    for row in reader:
        counter[row[0]] += abs(float(row[1]))

现在,如果你真的需要使用香草字典,那么你只需要稍微膨胀你的计数逻辑,即代替

counter[row[0]] += abs(float(row[1]))

DO

my_dict = {}
...
if row[0] not in my_dict:
    my_dict[row[0]] = abs(float(row[1]))
else
    my_dict += abs(float(row[1]))