即插即用机器学习

时间:2012-11-26 23:46:28

标签: c# python sql sql-server-2008 tsql

开始使用机器学习最简单的方法是什么?

我有一个非常实际的应用程序。

一些经理在我的膝盖上扔了一个数据仓库的“东西”,要求我告诉他们什么是推动销售。

数据包括:

sales by client (clients being doctors offices)
sales by doctor
products they bought
client demographics
all kinds of different date information

总结数据,它基本上是公司与所有客户进行的每笔交易的完整数据以及每笔交易的详细信息。

数据全部存储在sql server 2008中。

问题: c#/ python中是否存在任何可以连接数据库的工具,这些数据库将开始分析趋势/模式/关系?

更具体地说: 如何使用python或c#将机器学习算法应用于我的数据,以便提取某种有意义的信息?

3 个答案:

答案 0 :(得分:1)

您可以获得SQL Server 2008中捆绑的数据挖掘工具。您应该首先搜索“SQL Server 2008中的数据挖掘简介”等实际示例。

答案 1 :(得分:1)

我不确定从哪里开始接近这个问题。首先,这里的问题不是“机器学习”。没有软件可以接收一堆数据库表并回答诸如“什么是推动销售”之类的问题。天哪,人们甚至都没有做好这一点,所以对无人监督的计算机要求很多。

我不清楚数据是否包含问题的答案。数据确实包含已销售产品和各种其他因素的描述。这些“推动”销售是否相当主观。

其他人对编程工具提出了宝贵的建议。我强烈建议您专注于数据挖掘工具而不是编程工具。 SQL Server确实内置了一个工具。我不确定这是否有帮助。您可以找到工具列表here。其中一些是免费软件。如果您通过编程访问它们,您将面临两个问题。首先,您只关注问题的“编程”方面而不是结果。第二,即使你找到了好的结果,你也无法与他人交流。

最后,我对他们真正想要的东西的猜测是一个可以沿着各种维度对数据进行切片和切块的工具 - 也可以在SQL Server中使用。您可以按照事实表结构组合一组表(正如Ralph Kimball在他的书中描述的那样,如“数据仓库工具包”)。这听起来像是报告问题,而不是机器学习问题。

答案 2 :(得分:1)

谷歌有一个预测/机器学习API,如果你对结果比对理解更感兴趣,那就太棒了(尽管有一些背景肯定会有所帮助,所以你可以知道如果你有什么试图做甚至有意义。)

https://developers.google.com/prediction/