Zip稀疏序列

时间:2016-04-05 20:44:59

标签: scala

我有两个对象序列,其中对象共享一个公共属性(让我们称之为id)

case class ThingA(id: Int, someAttribute: String)
case class ThingB(id: Int, someOtherAttribute: Float)

我想加入"稀疏"列表,也就是说每个ThingA.id可能与ThingB.id不匹配,反之亦然。每个列表中的ID都是唯一的。

示例输入:

val thingAs = Seq(ThingA(0, "foo"), ThingA(1, "bar"))
val thingBs = Seq(ThingB(0, 1.0), ThingB(2, 0.3))

期望的输出:

val zipped: Seq(Tuple[Option[ThingA], Option[ThingB]]) = Seq(
    (Some(ThingA(0, "foo")), Some(ThingB(0, 1.0))),   // Matching id = 0
    (Some(ThingA(1, "bar")), None),
    (None, Some(ThingB(2, 0.3))
)

我目前的尝试是这样的:

val zipped = (
    thingAs.map(a => (Some(a), thingBs.find(b => b.id == a.id))) ++
    thingBs.map(b => (thingAs.find(a => a.id == b.id), Some(b)))
).distinct

有效,但我希望有更好的方法。

1 个答案:

答案 0 :(得分:2)

一种方法是首先计算所有id的并集,然后使用查找映射获取相应的ThingAThingB实例,如@Dima建议的那样。

val lookupThingA = thingAs.map(x => x.id -> x).toMap
val lookupThingB = thingBs.map(x => x.id -> x).toMap

val zipped: Seq[(Option[ThingA], Option[ThingB])] =
    (lookupThingA.keySet | lookupThingB.keySet).map(i => (lookupThingA.get(i), lookupThingB.get(i))).toList

输出(请注意,您可以使用Set代替Seq):

(Some(ThingA(1,bar)),None)
(Some(ThingA(0,foo)),Some(ThingB(0,1.0)))
(None,Some(ThingB(2,0.3)))

(如果有人想改进这个,我会把它作为社区维基)