我正在处理一个用户为字符串的数据集(即B000GKXY4S)。我想将这些用户中的每一个转换为int,因此我可以在Apache Spark ALS中使用Rating(user:Int,product:Int,rating:Double)类。最有效的方法是什么?最好使用Spark Scala函数或python本机函数。
答案 0 :(得分:1)
如果您只想将任何匹配的String转换为int - String.hashCode()
。但是,您将不得不处理可能的哈希冲突。或者,您必须将每个字符转换为其int值并将所有这些字符追加(不添加)。