Question

我的目标是学习猪，以增强我的机器学习/统计分析工作的简历。我现在并不是真的对所有细节Hadoop细节感兴趣（虽然我很想在以后学习它们 - 即使有说明我也很难在我的机器上安装，我更像是一个统计数据而不是一个程序员）。是否有一些我可以学习猪的资源，并且可以轻松访问它实验，而不必从头开始学习Hadoop？

Answer 1

是。安装猪，然后在本地运行。它可以在本地做任何事情（尽管在大多数情况下更慢），它可以做到超过hadoop。

对于交互式shell（grunt）：

pig -x local

在本地运行pig脚本：

pig -x local some_script.pig

关于如何使用猪的最佳文档在Apache结束，他们也有pretty good tutorial。

Answer 2

试试Cloudera QuickStartVM，其中包括一个随时可用的Pig环境。

我可以在哪里学习使用Pig而无需设置Hadoop

2 个答案: