如何使用Spark ML ALS算法?

时间:2017-04-21 04:00:22

标签: scala apache-spark

我想在spark ML中使用ALS来预测开始。我的数据结构

        business_id|             user_id|          stars|
        +--------------------+--------------------+-----+
        |5UmKMjUEUNdYWqANh...|PUFPaY9KxDAcGqfso...|    4|
        |5UmKMjUEUNdYWqANh...|Iu6AxdBYGR4A0wspR...|    5|
        |UsFtqoBl7naz8AVUB...|uK8tzraOp4M5u3uYr...|    5|
        |cE27W9VPgO88Qxe4o...|fhNxoMwwTipzjO8A9...|    3|

ALS要求user_id和item_id为int。我尝试将字符串转换为 哈希码,它不起作用。

        +-----------+-----------+-----+
        |    user_id|business_id|stars|
        +-----------+-----------+-----+
        |-1483211020| -939110651|  4.0|
        |-1483211020| 1184210788|  4.0|
        |-1941267903|  304488013|  5.0|
        | 2081449993|-1999999294|  3.0|
        | 2081449993|-1809940661|  4.0|
        | 1089298712|  -84655838|  5.0|

        Root-mean-square error = NaN

如何使用scala转换id以继续Int?

0 个答案:

没有答案