我在python中有一个非常基本的问题。我想浏览一个csv文件的每一行并进行比较,看看第1行的第一个字段是否与下一行的第一个字段相同,依此类推。如果找到匹配,那么我想将该字段放在object1中,否则将该字段放在不同的object2中。最后我想计算object1与object2中有多少个字段。这可以在python中完成吗?这是一个小例子。
BRM_1 679 1929
BRM_1 203 567
BRM_2 367 1308
BRM_3 435 509
正如您所看到的,line1的field1与line2的field2相同,因此字段BRM_1应该放在object1中,而BRM_2和BRM_3应该放在object2中。所以object1的最终数字是1,object2是2。
答案 0 :(得分:1)
当我看到这个问题没有得到答复时我感觉很糟糕。不知道你是否还需要答案,但我们走了。我假设您知道如何读取文件并从中列出列表
file1=[['a',1,2],['a',3,4],['b',4,5],['c',3,5]]
li1=[] #first obj
li2=[] #second obj
skip_next = False
file_len = len(file1)
for current_row_num,row in enumerate(file1):
if skip_next:
skip_next = False
pass
else:
if current_row_num == (file_len-1):
# alone
li2.append(row)
elif row[0]!=file1[current_row_num+1][0]:
#current row belongs in obj2
li2.append(row)
else:
# current row has same first col value as next row
# append both to li1
li1.append(row)
li1.append(file1[current_row_num+1])
skip_next=True
print "first obj\n"+str(li1)
print "second obj\n"+str(li2)
Outout看起来像
first obj
[['a', 1, 2], ['a', 3, 4]]
second obj
[['b', 4, 5], ['c', 3, 5]]
我相信这就是你要找的东西。如果您不关心订单,只是想知道行是否有对应的代码,那么代码就会简单得多。