我想在spark ML中使用ALS来预测开始。我的数据结构
business_id| user_id| stars|
+--------------------+--------------------+-----+
|5UmKMjUEUNdYWqANh...|PUFPaY9KxDAcGqfso...| 4|
|5UmKMjUEUNdYWqANh...|Iu6AxdBYGR4A0wspR...| 5|
|UsFtqoBl7naz8AVUB...|uK8tzraOp4M5u3uYr...| 5|
|cE27W9VPgO88Qxe4o...|fhNxoMwwTipzjO8A9...| 3|
ALS要求user_id和item_id为int。我尝试将字符串转换为 哈希码,它不起作用。
+-----------+-----------+-----+
| user_id|business_id|stars|
+-----------+-----------+-----+
|-1483211020| -939110651| 4.0|
|-1483211020| 1184210788| 4.0|
|-1941267903| 304488013| 5.0|
| 2081449993|-1999999294| 3.0|
| 2081449993|-1809940661| 4.0|
| 1089298712| -84655838| 5.0|
Root-mean-square error = NaN
如何使用scala转换id以继续Int?