前几天刚刚开始python,对整个多线程概念不熟悉。在多线程处理时写入文件时遇到问题。如果我以常规方式进行,它将不断覆盖正在编写的内容。
使用5个线程时写入文件的正确方法是什么?
答案 0 :(得分:2)
不降低性能的最好方法是在所有线程之间使用一个队列,每个线程都会枚举一个项目,而一个主线程只是将一个项目deque并将其写入一个文件,该队列是线程安全的并且阻塞时它是空的,或者更好,如果可能的话,只需返回5个线程中的所有值,然后将其写入文件,IO往往是我们可以做的更昂贵的操作之一,所以最好限制它和我们一样多可以。
另请注意,如果要利用多个处理引擎,python中的线程不会利用多个核心,导致GIL使用multiprocessing。
这是一个简单的例子:
from multiprocessing import Process, Queue
def test_1(q):
for i in range(10):
q.put('test_1: ' + str(i))
def test_2(q):
for i in range(10):
q.put('test_2: ' + str(i))
q = Queue()
p1 = Process(target=test_1, args=(q,))
p2 = Process(target=test_2, args=(q,))
p1.start()
p2.start()
with open('test.txt', 'w') as file:
while p1.is_alive() or p2.is_alive() or not q.empty():
try:
value = q.get(timeout = 1)
file.write(value + '\n')
except Exception as qe:
print "Empty Queue or dead process"
p1.join()
p2.join()
以及test.txt
的内容:
test_1: 0
test_1: 1
test_1: 2
test_1: 3
test_1: 4
test_2: 0
test_1: 5
test_2: 1
test_1: 6
test_2: 2
test_1: 7
test_2: 3
test_1: 8
test_2: 4
test_1: 9
test_2: 5
test_2: 6
test_2: 7
test_2: 8
test_2: 9
答案 1 :(得分:1)
一种方法是锁定文件,这样一次只有一个线程可以访问它;检查threading.Lock。