我有一个4623行的文本文件和0s和1s字符串形式的条目(例如01010111)。我逐个字符地比较它们。我有几个数据集,字符串长度为100,1000和10,000。 1000小时需要25小时才能计算10,000小时需要60小时。有没有办法加快速度?我尝试使用多处理库,但它只是重复值。也许我错了。代码:
f = open("/path/to/file/file.txt", 'r')
l = [s.strip('\n') for s in f]
f.close()
for a in range(0, len(l)):
for b in range(0, len(l)):
if (a < b):
result = 0
if (a == b):
result = 1
else:
counter = 0
for i in range(len(l[a])):
if (int(l[a][i]) == int(l[b][i]) == 1):
counter += 1
result = counter / 10000
print((a + 1), (b + 1), result)
我是python的新手,所以我认为这段代码需要一些优化。任何帮助都会很好。提前谢谢。