在Lparallel API中,建议终止所有线程任务的方法是使用(lparallel:end-kernel)
停止内核。但是,当线程正在阻塞时(例如,(pop-queue queue1)
等待某个项目出现在队列中时),当内核停止运行时,它仍将处于活动状态。在这种情况下(至少在SBCL中),内核关闭偶尔(但并非每次)失败,并显示以下信息:
debugger invoked on a SB-KERNEL:BOUNDING-INDICES-BAD-ERROR in thread
#<THREAD "lparallel" RUNNING {1002F04973}>:
The bounding indices 1 and NIL are bad for a sequence of length 0.
See also:
The ANSI Standard, Glossary entry for "bounding index designator"
The ANSI Standard, writeup for Issue SUBSEQ-OUT-OF-BOUNDS:IS-AN-ERROR
debugger invoked on a SB-SYS:INTERACTIVE-INTERRUPT in thread
#<THREAD "main thread" RUNNING {10012E0613}>:
Interactive interrupt at #x1001484328.
我认为这与阻塞线程无法正确终止有关。关闭内核之前,应该如何正确终止阻塞线程? (API说明kill-tasks
仅应在特殊情况下使用,我认为这种情况不适用于这种“正常”关机情况。)
答案 0 :(得分:5)
杀死线程的问题是,线程可能处于任何未知状态时,它可能发生在任何地方。 安全终止线程的唯一方法是让其正常关闭,这意味着您希望在正常操作期间,线程有一种方法可以知道它应该停止工作。然后,您可以正确清理资源,关闭数据库,释放外部指针,记录所有内容,...
您正在使用的队列的操作可能会超时,这是一种简单而又安全的方法,可确保您避免永远阻塞并正确退出。但这不是唯一的选择(除了下面显示的以外,您还可以使用它们。)
发生超时或收到消息时,请检查一个全局布尔变量(或在所有感兴趣的线程之间共享的布尔变量)。这也是退出的一种简单方法,可以被多个线程读取。但是,这是并发访问,因此您应该使用锁或原子操作(http://www.sbcl.org/manual/#Atomic-Operations),例如,使用defglobal
和带有atomic-incf
的fixnum类型,等等。
在队列中发送控制数据,并使用它们来确定如何正常关闭,如何在管道中传播信息或如何重新启动。这是安全的(只是传递消息),并允许您在线程中实现任何类型的控制。
(defpackage :so (:use :cl :bt :lparallel.queue))
(in-package :so)
让我们定义两个服务。
第一个回显其输入:
(defun echo (in out)
(lambda ()
(loop
for value = (pop-queue in)
do (push-queue value out)
until (eq value :stop))))
请注意,在输入:stop
的情况下预期如何正确完成,以及如何将:stop
消息传播到其输出队列。
第二个线程将执行模块化加法,并且在两次请求之间休眠:
(defun modulo-adder (x m in out)
(lambda ()
(loop
for value = (progn (sleep 0.02)
(pop-queue in))
do (push-queue (typecase value
(keyword value)
(number (mod (+ x value) m)))
out)
until (eq value :stop))))
创建队列:
(defparameter *q1* (make-queue))
(defparameter *q2* (make-queue))
创建线程:
(progn
(bt:make-thread (echo *q1* *q2*) :name "echo")
(bt:make-thread (modulo-adder 5 1024 *q2* *q1*) :name "adder"))
两个线程都以循环方式相互连接,从而形成无限的附加循环。当前线程之间没有交换任何值,您可以看到它们正在以slime-list-threads
或任何其他实现提供的方式运行;例如,无论如何,(bt:all-threads)
都会返回一个列表。
slime-list-threads
10 adder Running
11 echo Running
...
添加一个项目,现在线程之间可以无限交换数据:
(push-queue 10 *q1*)
等待,然后将它们都停止:
(push-queue :stop *q1*)
两个线程都正常停止(在线程列表中不再可见)。 我们可以检查队列中剩余的内容(结果因一项测试而异):
(list (try-pop-queue *q1*)
(try-pop-queue *q2*))
(99 NIL)
(list (try-pop-queue *q1*)
(try-pop-queue *q2*))
(:STOP NIL)
(list (try-pop-queue *q1*)
(try-pop-queue *q2*))
(NIL NIL)
您创建了一个由消息或全局标志控制的服务,但是您遇到了一个错误,线程挂起。除了要杀死它并失去一切之外,您至少希望适当地释放线程堆栈。这也很危险,但是您可以使用bt:interrupt
在当前正在运行的任何地方停止线程 并执行函数。
(define-condition stop () ())
(defun signal-stop ()
(signal 'stop))
(defun endless ()
(let ((output *standard-output*))
(lambda ()
(print "START" output)
(unwind-protect (handler-case (loop)
(stop ()
(print "INTERRUPTED" output)))
(print "STOP" output)))))
启动它:
(bt:make-thread (endless) :name "loop")
这将打印"START"
并循环播放。
然后我们中断它:
(bt:interrupt-thread (find "loop"
(bt:all-threads)
:test #'string=
:key #'bt:thread-name)
#'signal-stop)
将打印以下内容:
"INTERRUPTED"
"STOP"
如果线程被杀死,则不会打印这些消息,但是请注意,鉴于中断的随机性,您仍然可以设法破坏数据。而且,它可以取消阻止sleep
或pop-queue
之类的阻塞呼叫。