我正在尝试将csv转换为dict,但我无法获得正确的输出。
基本上我有一个csv文件,它包含第6和第7列中的整数,应该在dict中的'lat'和'lon'中转换。
这就是我正在尝试的:
with open('secondhand_data.csv', 'rb') as f:
reader = csv.reader(f, delimiter=';')
output2['lon'] = {row[6] for row in reader}
output2['lat'] = {row[7] for row in reader}
我的结果是:
{'lat': set([]), 'lon': set(['', '16.33052', '16.38002', '16.38414', '16.34794', '16.34797', '16.33351', '16.46922', '16.33353', '16.33367', '16.38552', '16.33354', '16.41716', ...])}
但我需要的是:
{'lat': ['53.1445116550943', '53.134787053494', '53.1383785260816', '53.330366', '55.8611098159417', ...], 'lon' : ['', '16.33052', '16.38002', '16.38414', '16.34794', '16.34797', '16.33351', ...]}
有谁知道我做错了什么? 非常感谢提前!
@jacoblauw:csv文件看起来像这样...它有点乱,对不起。
Waage, Deko/ Vintage/ Retro/ Nostalgie;http://www.willhaben.at/iad/kaufen-und-verkaufen/d/waage-deko-vintage-retro-nostalgie-208813335/;"
Doris S.";10;1030 Wien, 03. Bezirk, Landstraße; ;16.38575;48.19149;Fasangasse, Ecke Rennweg1030 Wien, 03. Bezirk, LandstraßeWien
schloss;http://www.willhaben.at/iad/kaufen-und-verkaufen/d/schloss-208789390/;"
Angelina";10;1100 Wien, 10. Bezirk, Favoriten; ;16.35809;48.17209;Hardtmuthgasse1100 Wien, 10. Bezirk, FavoritenWien
RC Boot;http://www.willhaben.at/iad/kaufen-und-verkaufen/d/rc-boot-208786703/;"
privat";15;1100 Wien, 10. Bezirk, Favoriten; ;;;
taschenmesser solingen dirlam & Sohn Söhne horn kleine beschädigung mit hülle;http://www.willhaben.at/iad/kaufen-und-verkaufen/d/taschenmesser-solingen-dirlam-sohn-soehne-horn-kleine-beschaedigung-mit-huelle-208768953/;"
rabe";25;1200 Wien, 20. Bezirk, Brigittenau; ;16.37349;48.23059;brigittenau1200 Wien, 20. Bezirk, BrigittenauWien
Konvolut Gama Norev Matchbox Lesney Corgi Wiking Schuco piccolo...14 teilig, alt, defekt;http://www.willhaben.at/iad/kaufen-und-verkaufen/d/konvolut-gama-norev-matchbox-lesney-corgi-wiking-schuco-piccolo-14-teilig-alt-defekt-208752031/;"
Peter";50;1190 Wien, 19. Bezirk, Döbling; ;16.35537;48.27574;Heiligenstädterstr.1190 Wien, 19. Bezirk, DöblingWien
DAS HAUS DER SCHWÄNE/ A. J. CRONIN, geb. Jubiläumsausgabe von 1934,;http://www.willhaben.at/iad/kaufen-und-verkaufen/d/das-haus-der-schwaene-a-j-cronin-geb-jubilaeumsausgabe-von-1934-208735636/;"
Annemarie";5;1230 Wien, 23. Bezirk, Liesing; ;16.28017;48.15508;Karl Schwed Gasse1230 Wien, 23. Bezirk, LiesingWien
Röhrenradio;http://www.willhaben.at/iad/kaufen-und-verkaufen/d/roehrenradio-208710345/;"
答案 0 :(得分:2)
用列表推导替换你的集合理解。此外,您的数据不一致。要处理这个问题,您应该将代码放在try-except大括号中,并检查非空值。
import csv
with open('...', 'r') as f:
reader = csv.reader(f, delimiter=';')
output2 = { 'lat' : [], 'lon' : [] }
for row in reader:
try:
if row[7] != '' and row[6] != '':
output2['lat'].append(row[7])
output2['lon'].append(row[6])
except:
pass
print(output2)
输出:
{'lat': ['48.17209', '48.23059', '48.27574', '48.15508'], 'lon': ['16.35809', '16.37349', '16.35537', '16.28017']}
答案 1 :(得分:2)
您正在使用集合理解并将该集合附加到密钥。这个问题有三个方面:
1)你踩过读者两次。
2)集合是无序的。
3)仅设置存储1个任意值的副本
试试这个:
output2 = {'lat': [], 'lon': []}
with open('secondhand_data.csv', 'rb') as f:
reader = csv.reader(f, delimiter=';')
for row in reader:
output2['lat'].append(row[7])
output2['lon'].append(row[6])
答案 2 :(得分:2)
你可以这样做:
dct = {'lat': [], 'lon': []}
with open('secondhand_data.csv', 'rb') as f:
reader = csv.reader(f, delimiter=';')
for row in reader:
dct['lat'] += list(row[7])
dct['lon'] += list(row[6])