情况如下:我们正在为一位客户进行POC,该客户使用MATLAB分析放射治疗的医学图像。通过基于微服务的漂亮框架实现了一切自动化。这样,从文件进入特定(Windows)文件位置的那一刻起,所有内容都会自动执行,直到所有内容都得到处理和分析。 客户要求我们使用他们的软件进行POC,看看它是否在HADOOP上运行得更快。我们此时的想法是在Windows上运行所有内容,但将文件保存在Hadoop上。但这意味着MATLAB运行时必须连接到HDFS。我们的Hadoop系统实际上是Microsoft HDInsight,是Microsoft APS的一部分。
已经编译了自己的运行时,但我们也有运行时的源代码。我们无法在安装了Hadoop的Windows服务器上安装任何设备。我们有一台能够连接到Hadoop服务器的服务器,我们已经安装了Matlab运行时。
我们如何处理? 是否可以将需要分析的文件放在Hadoop上从windows机器执行MATLAB运行时? 我对此事的看法是否太简单了?或者我们是否需要编写需要集成到MATLAB运行库中的map / redcue代码?