机器学习开发环境

时间:2013-05-06 08:28:07

标签: python r haskell machine-learning

我使用python在机器学习中做原型,但经常对缓慢的解释器感到沮丧。是否有一种适合原型的语言(足够的库,如sklearn,numpy,scipy),但同时速度快,是一种强大的语言。

我正在寻找的是我可以在生产中进行原型设计和部署的东西。人们通常使用什么?

3 个答案:

答案 0 :(得分:2)

据我所知,如果你想要一个包含大量库的真实语言,那么Python就像它一样好。

MATLAB可能是最受欢迎的原型商业解决方案。它有许多内置插件,易于操作。在性能方面,MATLAB目前在原型设计方面处于领先地位,仅次于生产的编译语言(C,Fortran,C ++,...)。但是,这不是一种合适的语言,所以我猜这不是你想要的。

答案 1 :(得分:2)

Python与你描述的那种原型一样好。但是,我不得不问,如果你对它作为数字语言的速度感到沮丧:你是如何编写代码的?在Python中执行此操作的方法是使用Numpy,这是一个用于数值计算的包,其中使用编译的C代码执行数组(矩阵)上的基础操作。它确实意味着学习如何将计算表达为矩阵运算,因此,如果您不习惯线性代数/矩阵操作,那么可能需要一些习惯。它基本上是一个类似Matlab的环境。

我的经验:如果你使用大量循环,元素操作等编写python代码,那么它很慢而且很难看。一旦你学会了等效的Numpy / Scipy方式,速度提升就是惊人的(你写的也更接近数学表达式)。

答案 2 :(得分:1)

您可以在Python RPy中使用R.这样你就可以在python程序中使用R功能进行进一步的使用。

根据您的目的,您还可以查看OpenCV Python,了解更低级别的机器学习工具(SVM ...)