我的输入数据集中的一列值如下:
“ Super Singers 10/23 05:30A T (30) on Star (maa)
”
我需要获取播放时间,该播放时间在方括号中。 对于上述值,播放持续时间为30
我需要在spark中使用scala。这种字符串是否有任何模式匹配?
答案 0 :(得分:1)
scala> val value = "Super Singers 10/23 05:30A T (30) on Star (maa)"
value: String = Super Singers 10/23 05:30A T (30) on Star (maa)
scala> val pat = """\([0-9]+\)""".r
pat: scala.util.matching.Regex = \([0-9]+\)
scala> pat.findFirstIn(value).mkString.replaceAll("""\(""","").replaceAll("""\)""","")
res9: String = 30