我正在尝试创建自定义推理方案,该方案允许彼此独立地计算查询图像的模型。为此,我有一个graphDef和一个会话对象。我也有带有图像的输入队列,这些图像将它们喂给“工人”-只是围绕session.Run(...)的简单包装。每个工作程序都在其自己的线程中运行,并且具有其自己的使用者(在本示例中为/ dev / null),因此我希望与一个工作程序方案相比,我的性能大约为xNumWorkers。不幸的是,我发现,该管道速度等于一个工人的速度,而与工人的数量无关。
我对这个方案的期望是否错误,或者我做错了什么,从理论上讲,它应该将性能提高到与num工人大致成线性关系?