我的公司在MS BI Stack(SQL Server Reporting Services,-Analysis Services和-Integration Services)上投入了大量资金,但我想看一下看似最受关注的开源替代Pentaho的内容。
我已经安装了一个版本,并且我非常轻松地完成并运行。这很好。但我还没有时间开始将它用于实际工作,以便彻底了解该软件包。
你们是否对Pentaho与MS BI的利弊有什么见解,或有任何相关的链接?
非常感谢!
答案 0 :(得分:51)
我在路径上查看了多个Bi堆栈以获取Business Objects。我的很多评论都是偏好。这两套工具都非常出色。有些事情是我喜欢巧克力软糖布朗尼冰淇淋而不是纯巧克力。
Pentaho有一些非常聪明的人与他们合作,但微软一直在资金充足且计划周密的道路上。请记住,MS仍然是数据库市场的弱势群体。甲骨文在这里是王道。为了具有竞争力,MS在购买数据库时已经赠送了很多好东西并被迫重新发明他们的平台几次。我知道这不是关于数据库的,但数据库之争导致MS为了增加堆栈价值而放弃了很多。
1。)平台
SQL服务器无法在Unix或Linux上运行,因此它们会自动排除在此市场之外。 Windows与现在的某些版本或Unix大致相同。 Windows非常便宜,现在运行得非常好。它给我带来了与Linux一样多的麻烦。
2。)OLAP
分析服务于2005年(目前是2008年)在2000年版本上进行了重新设计。这是一个超过2000年的强大的命令。一旦你变大,pentaho(蒙德里安)并不那么快。它也很少有功能。它非常好,但工具的方式较少。两者都支持Excel作为esscential的平台。 MS版本更强大。
3。)ETL
MS - DTS已被SSIS取代。再次,大规模的速度,力量和能力的增加。它控制任何和所有数据移动或程序控制。如果它不能这样做,你可以在Powershell中编写一个脚本。与2008年发布的Informatica相同。
Pentaho - 比过去好多了。没有我想要的那么快,但我可以做我想做的一切。
4。)仪表板
Pentaho改善了这一点。开发有点不舒服和不友好,但MS确实没有真正的等价物。
5。)报告
MS报告非常强大,但并不是很难使用。我现在很喜欢它,但一开始就讨厌它,直到我知道它好一点。我一直在使用水晶报告,MS报告构建器功能更强大。在MS中很容易做一些艰难的事情,但做一些简单的事情要困难一些。
Pentaho有点笨拙。我可能根本不喜欢它。我发现它太复杂了。我希望它更像是Crystal报表生成器或MS报表生成器,但它更像是jasper。我觉得很难。这可能是一种偏好。
6。)ad hoc
MS - 这是我真正的赢家。我与我的用户测试了它,他们立刻爱上了MS用户报告构建器。最重要的是它不仅易于使用,而且具有生产力。
Pentaho - 很好但很老派。它使用更典型的基于向导的模型并具有强大的工具,但我讨厌它。它是一个很好的工具,但是我们已经从这种风格转变,没有人想回去。与logiXML相同的问题。界面运行良好,但与我们使用12年的情况相比并没有太大变化。
http://wiki.pentaho.com/display/PRESALESPORTAL/Methods+of+Interactive+Reporting
有一些经验丰富的人可以让Pentaho真正运行良好,我只是发现MS套件更有效率。
答案 1 :(得分:8)
警告 - 有很多网站列出了SSIS的众多缺陷,错误和烦恼。不确定为什么SSIS在帖子中名列前茅 - 但在你打赌它的项目之前,看看人们在博客圈中要说些什么。根据我的经验,大约20:1的咆哮声与SSIS的可怕性有关 - 我也同意,目前正在寻找替代方案。
答案 2 :(得分:7)
这里有很棒的信息?我没有尝试Pentaho但是计划检查它。我是一名经验丰富的MS BI顾问,自1998年以来一直使用它.SSIS非常快速且非常强大,但批评很明显。我发现了SSIS的以下问题:
(1)很难调试,你会得到一些神秘的错误,这些错误可能不会给你任何关于问题究竟是什么和在哪里的暗示。
(2)根据之前的评论,这是最糟糕的开发环境!我不知道他们在想什么。
(a)创建一个包含100个或更多列的表,并在其上放置合并连接。现在回过头来尝试更新合并连接(比如拉一个新列)。在合并连接上单击“确定”以保存更改后,即使在最快的计算机上也可能需要几分钟。我有一个巨大的数据流,有很多广泛的记录和许多合并连接。向数据流添加一列需要半天以上。我更新了一个合并连接,然后必须去做其他事情并在5-10分钟后再回来查看是否完成了。微软对此的回应是将您的软件包分解为多个软件包,将数据放在表格或二进制文件之间。好吧,如果你要在所有步骤之间使用磁盘,那么你可能在SQL中完成了所有工作! ETL工具的主要目的之一是将所有这些内容存储在内存中并避免磁盘I / O.
(b)设计师有时会彻底崩溃,失去你上次保存以来的所有工作(我现在因为这个而在睡梦中做ctrl-S)
(c)我必须找出一个hack并在Excel中生成SSIS包XML以获得广泛的记录。我有一个医疗保健客户端,600多列记录是常见的。如果您尝试在SSIS中定义具有600列的文件格式,则必须一次一个地键入每个列!即使是MS访问,您也可以将电子表格中的布局剪切并粘贴到文件布局中,而不是SSIS。所以我必须从布局生成XML并将XML代码粘贴到包中的正确位置。这样做很丑陋,但它节省了整天的工作和很多错误。
(d)与(c)类似,如果您需要修剪所有列,并且您已经说了600多个,请猜猜是什么?在派生列组件中,您必须键入trim(column1)600次以上!我现在在SQL查询中执行这样的所有简单转换以获取数据,因为这可以很容易地从Excel工作表生成。
(e)有许多古怪的东西,组件变得不可见,有时你打开包装,所有组件都完全不加思索地重新排列。
(f)FTP功能,可能是ETL中最常见的东西之一,功能很弱,只支持无人使用的普通FTP。这些天每个人都使用SFTP,FTPS,https等...所以几乎每个实现都需要使用第三方推荐的行驱动文件传输应用程序包。
(g)尝试使用CYA,类似于Windows Vista中的荒谬安全性,微软已经非常难以将SSIS包从一个环境推广到另一个环境。它默认为“使用用户密钥加密敏感信息”这一愚蠢的事情,这意味着它必须在您将其移动到的环境中的同一帐户下运行,作为您开发它的环境,这种情况很少发生。有更好的配置方法,但它总是试图恢复到这种完全无用的安全保护。
(h)最后,大多数问题现在都出现在第3版中,这清楚地表明微软没有计划修复它们。
(i)调试并不像其他语言那么容易。
SSIS仍然有很多好处,但并非没有一些严重的痛苦。
答案 3 :(得分:4)
多年前我开始使用MS Reporting Services而且非常喜欢它。我没有尝试过Penaho的报告解决方案,因此我无法评论它。我也没有尝试过Analysis Services或Pentaho的替代方案。
最近我需要一个ETL解决方案并且熟悉MSSQL和MSRS,我很明显会审查并且可能选择MS Integration Service。但对我来说,MSIS太可怕了。主要是因为它不直观。在花了几天时间尝试学习该工具之后,我决定寻找替代方案并遇到了Pentaho Data Integration,以前称为Kettle。我在几分钟内完成并运行并立即创建了我的第一个转换。它只是有效。
不可否认,我的需求相当简单,但表现一直很好,社区似乎非常有帮助。
答案 4 :(得分:4)
我使用过SSIS和Pentaho Kettle,我强烈推荐使用Pentaho Kettle作为ETL工具而不是SSIS。
我的理由: - SSIS的流程是任务的任务。 Kettle让您考虑流经系统的数据行。对我来说,水壶的方法似乎更直观。 -SSIS记录很少。有时候是这样的。但似乎有很多角落点击和设置变量。非常复杂。 Pentaho有一个非常有帮助的社区论坛。 - 我相信Pentaho可以与多种类型的数据库集成,包括SQL Server。你也可以使用很好的JDBC。另外,我用它一边是SQL Server和Oracle,另一边是Vertica。它在Vertica上有一个批量加载器。那太好了。 - 相对来说,我发现在服务器上运行SSIS包是非常非常困难的。这不值得我的时间。 - 我发现Pentaho很容易将警告或错误信息邮寄给某人或某人。 -Pentaho允许在JavaScript中完成任务,以处理需要某些逻辑的事情。使用我们大多数人遇到的语言简单易用。
答案 5 :(得分:3)
我不能在MS BI堆栈上提供任何输入,但是在最近的Barcamp Orlando,来自Pentaho的人们在那里谈论他们的产品,这是一个非常令人印象深刻的演示。
事实上,这是一个开源项目,您可以扩展自己以及付费套餐以获得真正优质的服务,这为您提供了很多选择。他们展示了他们为客户做的一些有偿工作,他们肯定让人群惊叹不已。
我还有机会与Pentaho的数据仓库方面的开发人员聊天,他非常敏锐,对建议非常开放,并且在回答任何问题时没有任何问题。
就公司而言,Pentaho的工作以及他们所有开发人员的友好和平易近人给我留下了深刻的印象。
答案 6 :(得分:3)
要添加几点
需要根据更大的文化问题来解决工具问题 - 哪种商店使用开源工具?根据我的经验,我发现微软的商店似乎更加僵化,当你在微软商店遇到连接字符串时,你可以得到帮助..在Pentaho和Linux商店中它的DYI更多。
BTW,请注意Pentaho销售人员正在进行的演示 - 他们展示的所有东西都比看起来要困难得多! :)答案 7 :(得分:0)
如果您正在寻找一个强大,低成本的大男孩替代品,LogiXML在.NET平台上提供仪表板和临时报告。自从Pentaho刚刚开始使用以来,我们一直在使用它们,但我有一段时间没有看过它。
答案 8 :(得分:0)
我最近尝试过pentaho开源BI。我发现它非常笨拙。它不是很直观,开发时间也要长得多。
与Oracle或ms BI解决方案完全不同。也许企业版更好。