我有这种形式的数据,这基本上是一个巨大的数据。
val data: Array[(Int, Iterable[String])] =
Array(
(34,List("sdkfj",7, 2, 5, 3, 1, 9, 2, 1, 4)),
(4,List(7, 14, 4, 5, 11, 9, 5, 4, 1))
)
我想在可迭代项目上应用一个函数isNumeric
,它应该按以下方式返回输出
Array((34,false), (4,true))
基本上,如果列表中的任何元素不是数字,我想要false
,否则true
。
我试过这个功能
def isNumeric(input: String): Boolean = input.forall(_.isDigit)
但在这种情况下,我得到一个布尔列表,而我想要整个列表的一个布尔结果。
答案 0 :(得分:5)
您需要在内部列表中调用.forall
:
scala> def isNumeric(input: String): Boolean = input.forall(_.isDigit)
isNumeric: (input: String)Boolean
scala> val a:Array[(Int,List[String])] = Array((34,List("sdkfj","7", "2", "5", "3", "1", "9", "2", "1", "4")), (4,List("7", "14", "4", "5", "11", "9", "5", "4", "1")))
a: Array[(Int, List[String])] = Array((34,List(sdkfj, 7, 2, 5, 3, 1, 9, 2, 1, 4)),
(4, List(7, 14, 4, 5, 11, 9, 5, 4, 1)))
scala> a.map { case (k, l) => (k, l.forall(isNumeric)) }
res0: Array[(Int, Boolean)] = Array((34,false), (4,true))
修改强>
如果您想跳过某些元素的验证,可以在使用.filter
之前使用.forall
(仅在子列表中运行验证):
scala> val a:Array[(Int,List[String])] = Array((34,List("NA","7", "3")))
a: Array[(Int, List[String])] = Array((34,List(NA, 7, 3)))
// Not sure what an NA is, so...
scala> def isNA(s:String) = s == "NA"
isNA: (s: String)Boolean
// Using .filterNot here since you want to exclude all `NA`s
// You can also use .filter(!isNA(_))
// or .withFilter(!isNA(_)) which should be faster/more efficient
scala> a.map{ case (k, l) => (k, l.filterNot(isNA).forall(isNumeric)) }
res0: Array[(Int, Boolean)] = Array((34,true))
请注意,您也可以将.isNumeric
方法更改为.isNumericOrNA
(从而省略对filter
的需求),尽管可能会有点混乱,具体取决于{{1}是的。
注意:有关NA
和.filter
之间差异的说明,请参阅Scala API。