我的目标是学习猪,以增强我的机器学习/统计分析工作的简历。我现在并不是真的对所有细节Hadoop细节感兴趣(虽然我很想在以后学习它们 - 即使有说明我也很难在我的机器上安装,我更像是一个统计数据而不是一个程序员)。是否有一些我可以学习猪的资源,并且可以轻松访问它 实验,而不必从头开始学习Hadoop?
答案 0 :(得分:5)
是。安装猪,然后在本地运行。它可以在本地做任何事情(尽管在大多数情况下更慢),它可以做到超过hadoop。
对于交互式shell(grunt):
pig -x local
在本地运行pig脚本:
pig -x local some_script.pig
关于如何使用猪的最佳文档在Apache结束,他们也有pretty good tutorial。
答案 1 :(得分:0)
试试Cloudera QuickStartVM,其中包括一个随时可用的Pig环境。