我是推荐系统的新手,并尝试在Apache Mahout和Spark ALS之间作为推荐器引擎的算法核心进行决策。
Mahout的火花项目相似性工作是否只有cli?
我遇到的唯一相关文档是:http://apache.github.io/mahout/0.10.1/docs/mahout-spark/index.html#org.apache.mahout.drivers.ItemSimilarityDriver $与cli有关。
另外,对于cli,我看到输入格式仅限于文本文件。这是否意味着我必须将存储在Cassandra中的所有数据转换为txt文件格式以使用spark项目相似性?
我已经在这里提到了火花项目相似性使用的介绍性文档 - https://mahout.apache.org/users/algorithms/intro-cooccurrence-spark.html。
非常感谢任何帮助和对相关文档的指示。