我正在尝试评估Datameer和Altreyx的bigdata分析需求。这两种工具的优点和缺点是什么?
答案 0 :(得分:4)
首先,完全披露:我是Datameer的技术产品营销高级总监,所以请以恰当的怀疑态度对待我所说的话。为了它的价值,我还为ZDNet写了大数据(但不是关于Datameer),我是Gigaom Research的大数据和分析研究总监。所以我对BI /大数据市场了解了一两件事。
有了这个,让我说Alteryx和Datameer实际上是相当不同的产品。即使我们的消息传递有时听起来相似,我们也会做不同的事情。
Alteryx非常出色地允许用户以图形方式设置工作流程以进行数据转换,然后在设计完成后运行这些工作流程。 Alteryx通过Hive及其ODBC驱动程序连接到Hadoop,将数据移出Hadoop以便处理它。
Alteryx作为Windows桌面应用程序运行,使用的UI看起来很像集成开发环境(IDE)。如果您是开发人员,甚至是某种类型的超级用户(例如,喜欢偶尔编写一些代码的用户),那么您就会在家中。
另一方面,Datameer本身可以在Hadoop上运行。而不是通过Hive连接并将数据从Hadoop移动到我们的引擎中,Hadoop实际上是我们的引擎,这是最有意义的。我们使用电子表格隐喻而不是图形工作流,允许用户在工作表中输入公式,以实现数据转换/整形/清理。我们的智能采样功能不是让您执行整个工作簿来查看结果,而是在设计时将数据引入,因此您可以在决定从端到端执行完整工作簿之前,以交互方式处理数据的子集。Datameer在Web浏览器中运行,而不是作为桌面应用程序运行,允许我们在Windows和Mac OS(例如)之间以及运行Android,iOS或Windows的平板电脑上运行跨平台。 Datameer可以在各种配置中在本地或作为服务运行。使用我们的个人和工作组产品,您可能会处理较小的数据量,我们绕过Hadoop并在内存中执行您的工作簿。
我们有高级模块做一些有趣的事情。智能执行可以简化您自己必须做出的一些Hadoop决策,包括是否使用MapReduce,Tez或我们的本地内存引擎。我们的智能分析模块可让您使用机器学习算法更好地理解您的数据,而且我们做的工作非常简短。
Alteryx基本上包含R来提供机器学习服务,并且本身用于预测分析,而不是用于数据发现。 Alteryx中的ML功能比我们的更全面,但它们基于插入到数据流中的R函数,而我们的ML功能是向导驱动的。我们的ML功能集更小,我们相信,更简单。从我们的角度来看,80-20规则适用。
Alteryx在整合消费者和空间数据方面做得很出色,可以计算和可视化某个行驶时间范围内的位置等事物。 Datameer没有类似的功能。另一方面,我们拥有超过60种本地连接器,可用于各种RDBMS,DW,NoSQL,社交和SaaS数据库和服务,并且它们都包含在内。 Alteryx可以整合的数据集来自每个席位的相对较高的成本,至少就公司网站上的列表价格而言(http://www.alteryx.com/products/pricing)。
Alteryx是具有悠久历史的BI产品,该公司在添加大数据功能方面做得很好,因为这些功能已经与市场相关。 Datameer是从头开始设计的大数据用例和技术。所以,真的,我们是非常不同的。你能用两种产品做同样的事情吗?当然。您也可以使用Excel宏进行相同类型的操作并使用C编码;这就是计算的工作原理。但我们的方法却截然不同。