在制作中使用PredictionIO

时间:2016-09-16 10:48:34

标签: amazon-web-services docker production predictionio

我已经在本地安装了PredictionIO,使用我根据需要修改的通用推荐模板训练了引擎,一切看起来都很好。

既然我知道这可以满足我的需求,我希望将其部署到生产中,遗憾的是,没有太多关于它的文档。

理想情况下,我希望在AWS上部署所有内容,有一部分文档描述它,但由于CloudFormation模板被禁用,因此无用。

我正在考虑使用Docker来实现它,但我对整个堆栈缺乏了解,并希望了解以下内容:

  • 应该在哪里存储数据? hbase似乎是“数据库”,将它与其余服务器放在同一台服务器上并不危险(事件服务器,预测服务器)?

  • 它如何扩展?我是否需要在负载均衡器后面运行多个PredictionIO实例,还是足够?若然,如何实现呢?

  • 什么是优秀的分布式架构?为了扩展,我很确定我们需要将EventServer与PredictionServer分开,这样做的好方法是什么?

希望有人可以提供帮助。谢谢。西里尔

1 个答案:

答案 0 :(得分:3)

  1. 数据应存储在何处?
  2. 根据PredictionIO网站:

      

    如果您决定将HBase安装到其他位置,则必须进行编辑   PredictionIO-0.10.0-incubating / conf / pio-env.sh并更改PIO_STORAGE_SOURCES_HBASE_HOME变量以指向您自己的HBase安装。

    该网页也提到了

      

    对于生产部署,请运行完全分布式HBase配置。

    1. 如何扩展?
    2. predition-io google group有一个很好的答案,它们可以分解成单独的部分

      1. 什么是优秀的分布式架构?
      2.   

        为了扩展,我非常确定我们需要将EventServer与PredictionServer分开,这样做的好方法是什么?

        分离摄取图层,处理图层和服务图层通常被认为是一种很好的做法,但您确实需要注意不要过度工程。这在很大程度上取决于您的具体使用情况,不要忘记您所做的每个分离都会给系统带来更多复杂性(部署,监控等)。