我需要解析一个键值coma分离文件。请找到附加的示例日志文件格式。
event_1,log_time:2013-11-05T08:33:37:293+00,user_id:2535285332077170,profile_id:8,nickname:2535285332077170,rank_id:7,shop_tr_status:OK,
event_2,log_time:2013-11-05T08:33:37:344+00,rule_id:18372990742769963554,user_id:2535285332077170,profile_id:8,
event_3,log_time:2013-11-05T08:33:37:401+00,user_id:2535285332077170,profile_id:8,nickname:2535285332077170
我的要求是,如果它是事件1,那么我需要log_time和昵称
如果是event_2,那么我需要userid和profileid
如果是event_3,那么我需要用户名和昵称
任何人都可以建议什么是继续这个
的最佳方式答案 0 :(得分:3)
忘记csv.reader。您应该将tablib与动态列一起使用:
ds = tablib.Dataset()
ds.csv = open(csvfile).read()
然后您可以添加以下列:
def event_data(row):
if row[0] == 'event_1':
return [row[1], row[4]]
# .. and so forth
ds.append_col(event_data, header='Event data')
根据第一栏,获取该列应该可以为您提供所需的数据。
答案 1 :(得分:1)
如果您有标题并想要提取特定列数据,请尝试
import csv
with open('csv_file.csv', 'rU') as csv_file:
csvreader = csv.DictReader(csv_file)
for row in csvreader:
print("Rows: " + str(row))
if row['header1'] == '1':
print('Data: ' + row['header2'])
CSV文件内容:
header1,header2,header3
1,2,3
4,5,6
输出:
Rows: {'header2': '2', 'header3': '3', 'header1': '1'}
Data: 2
Rows: {'header2': '5', 'header3': '6', 'header1': '4'}
如果您有大量数据,添加标题可以让您的生活更轻松,或者您必须使用csv.reader()并解析内容并根据需要进行拆分。
答案 2 :(得分:0)
使用for row in
csv.reader(),然后在for循环中放置if和some elif。