我正在编写一个WebSocket服务器,Web客户端连接到多线程计算机AI上下棋。 WebSocket服务器希望将Logger
对象传递给AI代码。 Logger
对象将管理从AI到Web客户端的日志行。 Logger
必须包含对客户端连接的引用。
我对生命周期如何与线程交互感到困惑。我用类型参数化的Wrapper
结构重现了这个问题。 run_thread
函数尝试解包该值并将其记录下来。
use std::fmt::Debug;
use std::thread;
struct Wrapper<T: Debug> {
val: T,
}
fn run_thread<T: Debug>(wrapper: Wrapper<T>) {
let thr = thread::spawn(move || {
println!("{:?}", wrapper.val);
});
thr.join();
}
fn main() {
run_thread(Wrapper::<i32> { val: -1 });
}
wrapper
参数存在于堆栈中,并且其生命周期不会延伸超过run_thread
的堆栈帧,即使该线程将在堆栈帧结束之前连接。我可以从堆栈中复制值:
use std::fmt::Debug;
use std::thread;
struct Wrapper<T: Debug + Send> {
val: T,
}
fn run_thread<T: Debug + Send + 'static>(wrapper: Wrapper<T>) {
let thr = thread::spawn(move || {
println!("{:?}", wrapper.val);
});
thr.join();
}
fn main() {
run_thread(Wrapper::<i32> { val: -1 });
}
如果T
是对我不想复制的大对象的引用,则无效:
use std::fmt::Debug;
use std::thread;
struct Wrapper<T: Debug + Send> {
val: T,
}
fn run_thread<T: Debug + Send + 'static>(wrapper: Wrapper<T>) {
let thr = thread::spawn(move || {
println!("{:?}", wrapper.val);
});
thr.join();
}
fn main() {
let mut v = Vec::new();
for i in 0..1000 {
v.push(i);
}
run_thread(Wrapper { val: &v });
}
结果是:
error: `v` does not live long enough
--> src/main.rs:22:32
|
22 | run_thread(Wrapper { val: &v });
| ^ does not live long enough
23 | }
| - borrowed value only lives until here
|
= note: borrowed value must be valid for the static lifetime...
我能想到的唯一解决方案是使用Arc
。
use std::fmt::Debug;
use std::sync::Arc;
use std::thread;
struct Wrapper<T: Debug + Send + Sync + 'static> {
arc_val: Arc<T>,
}
fn run_thread<T: Debug + Send + Sync + 'static>(wrapper: &Wrapper<T>) {
let arc_val = wrapper.arc_val.clone();
let thr = thread::spawn(move || {
println!("{:?}", *arc_val);
});
thr.join();
}
fn main() {
let mut v = Vec::new();
for i in 0..1000 {
v.push(i);
}
let w = Wrapper { arc_val: Arc::new(v) };
run_thread(&w);
println!("{}", (*w.arc_val)[0]);
}
在我的真实程序中,似乎Logger
和连接对象都必须放在Arc
包装器中。当代理并行化的库内部时,客户端需要在Arc
中对连接进行封装,这似乎很烦人。这尤其令人讨厌,因为保证连接的生命周期大于工作线程的生命周期。
我错过了什么吗?
答案 0 :(得分:16)
标准库中的线程支持允许创建的线程比创建它们的线程更长;这是好事!但是,如果要将对堆栈分配的变量的引用传递给其中一个线程,则无法保证该变量在线程执行时仍然有效。在其他语言中,这将允许线程访问无效内存,从而产生一堆内存安全问题。
幸运的是,我们不仅限于标准库。至少有两个包提供范围的线程 - 保证在某个范围结束之前退出的线程。这些可以确保堆栈变量在整个线程持续时间内可用:
还有一些板条箱可以抽象出“线程”的低级细节,但是可以让你实现目标:
以下是各自的示例。每个示例都会生成许多线程,并在没有锁定,没有Arc
且没有克隆的情况下改变本地矢量。请注意,该变异具有sleep
调用,以帮助验证调用是否并行发生。
您可以扩展示例以共享对实现Sync
的任何类型的引用,例如Mutex
或Atomic*
。但是,使用这些会引入锁定。
use scoped_threadpool::Pool; // 0.1.9
use std::{thread, time::Duration};
fn main() {
let mut vec = vec![1, 2, 3, 4, 5];
let mut pool = Pool::new(vec.len() as u32);
pool.scoped(|scoped| {
for e in &mut vec {
scoped.execute(move || {
thread::sleep(Duration::from_secs(1));
*e += 1;
});
}
});
println!("{:?}", vec);
}
use crossbeam; // 0.6.0
use std::{thread, time::Duration};
fn main() {
let mut vec = vec![1, 2, 3, 4, 5];
crossbeam::scope(|scope| {
for e in &mut vec {
scope.spawn(move |_| {
thread::sleep(Duration::from_secs(1));
*e += 1;
});
}
})
.expect("A child thread panicked");
println!("{:?}", vec);
}
use rayon::iter::{IntoParallelRefMutIterator, ParallelIterator}; // 1.0.3
use std::{thread, time::Duration};
fn main() {
let mut vec = vec![1, 2, 3, 4, 5];
vec.par_iter_mut().for_each(|e| {
thread::sleep(Duration::from_secs(1));
*e += 1;
});
println!("{:?}", vec);
}
当代码并行化的库内部时,客户端需要在
Arc
中封装连接
也许你可以更好地隐藏你的并行性?您可以接受记录器,然后将其包装在Arc
/ Mutex
中,然后再将其交给您的主题吗?