将包含字母的字符串有效转换为Int - Apache Spark

时间:2014-11-19 14:24:04

标签: java python scala apache-spark

我正在处理一个用户为字符串的数据集(即B000GKXY4S)。我想将这些用户中的每一个转换为int,因此我可以在Apache Spark ALS中使用Rating(user:Int,product:Int,rating:Double)类。最有效的方法是什么?最好使用Spark Scala函数或python本机函数。

1 个答案:

答案 0 :(得分:1)

如果您只想将任何匹配的String转换为int - String.hashCode()。但是,您将不得不处理可能的哈希冲突。或者,您必须将每个字符转换为其int值并将所有这些字符追加(不添加)。