我遇到这个问题的方案是: 我有一个文件观察器服务,寻找分隔的.txt文件并进行一些操作。在操作之后,我将调用一个web服务,它将多页tiff文件转换为word文档(.doc)和其他一些操作。
我正在文件观察程序服务级别运行一个调用Web服务的线程池。我最后指出并指出,在.tiff转换为.doc阶段时出现了瓶颈。
一点点信息,我正在处理的.tiff约为50页和4.3 mb。我想要转换几千个这样的文件(可能更大)。
我试图在线程池中运行.tiff的转换,但这无助于缩短时间。
我想知道什么可以帮助实现这种转换。
答案 0 :(得分:0)
如果您真的使用OCR软件将TIFF转换为DOC(不在文档中嵌入图像),我认为除了更快的硬件或更好的OCR软件之外,您的问题不会解决。< / p>
答案 1 :(得分:0)
我终于尖针和钻了 知道瓶颈发生在 将.tiff转换为.doc 阶段。
这不是一个精确定位。听起来这是代码的一个非常重要的部分。如果您使用的是第三方组件,则需要与供应商联系。如果它是您自己的代码,那么您需要更具体地说明性能问题发生的位置。
还值得注意的是,简单地将代码放在后台线程上不会使它更快。在大多数情况下,它会使速度变慢,除非您能够将作业分解为可以在物理CPU核心上并发运行的块,或者在I / O或锁定上有大量等待。如果你使用的是第三方组件,那么你可以用线程做很多事情来使单个转换工作的执行速度更快。
答案 2 :(得分:0)