使用Azure函数与Python - Numpy和Pandas

时间:2017-06-14 16:16:11

标签: python azure azure-functions

在Azure Functions中导入pandas会将执行时间减慢到20秒以上。

我正在尝试使用Azure Functions来构建一个HTTP触发的微服务,它可以在Python中进行一些数据分析。我编写的代码使用了Pandas和Numpy库。

我已关注the Azure tutorial to create a Hello World function。该功能能够在200毫秒内运行。

This answer helped me通过pip安装numpy和pandas,但只要在我的脚本中包含行import pandas,执行时间就会超过20秒!

我做错了什么吗?有没有办法加快速度?或者Azure Functions仅适用于不太复杂的python库?

1 个答案:

答案 0 :(得分:2)

我尝试按照你提到的SO thread和另一个blog来重现&测试关于导入pandas的这个问题太慢了。这是我的测试结果,仅用于在Kudu控制台中执行import pandas,如下图所示。

enter image description here

每次import pandas操作花费大约十秒钟。它是pandas numpy的旧issue,只有在关闭时才会被解析。所以这不是你的错,也不是Azure的。导入时间成本似乎只取决于机器性能。如果可能,您可以通过将App Service计划扩展到更高的计划来加快速度。

否则,我的建议是,当您需要处理大量数据时,发布Azure机器学习的Web服务以在Python中执行数据分析,或者在Azure Functions中手动使用using AdventureWorks2012编写一些代码。 / p>

希望它有所帮助。