Scala中快速打包的结构数组

时间:2012-11-05 05:02:00

标签: arrays performance scala

我正在研究如何将现有的混合Python / C ++数字代码库转换为混合Scala / C ++(从长远来看,理想情况下主要是Scala)。我希望最大的问题是打包结构数组。例如,在C ++中,我们有类似

的类型
Array<Vector<double,3>> # analogous to double [][3]
Array<Frame<Vector<double,3>>> # a bunch of translation,quaternion pairs

这些可以在Python和C ++之间来回转换,而不需要复制,这要归功于Numpy。

在JVM上,由于未装箱的数组只能有少数类型,我能想象的唯一方法就是为每个结构创建(1)盒装Scala类型,例如Vector<double,3>和(2)围绕Array[Double]的类型化薄包装器,它知道它应该是什么结构,并根据需要创建/使用盒装单例。

是否有任何现有的库可以执行此类操作,或者为打包的结构数组实现任何替代方法?有没有人有关于性能特征可能是什么的经验,以及现有编译器和JVM是否能够在至少非多态密封盒中优化盒子?

请注意,打包和精心打字不是可选的:如果没有打包,我会非常快速地打击内存,如果我拥有的是Array [Double] C ++的类型系统(不幸的话)获胜。

1 个答案:

答案 0 :(得分:3)

问题在于是否除了数字之外还有其他内容。如果它只是一堆双打,你可以在Scala中写一个包装,但你不应该指望避免拳击。相反,考虑编写可变包装器:

trait Vec3 {
  def x: Double
  def y: Double
  def z: Double
}
class ArrayedVec3(array: Array[Double]) extends Vec3 {
  private[this] var index = 0
  def goto(i: Int) = { index = i*3; this }
  def x = array(index)
  def y = array(index+1)
  def z = array(index+2)
}

您可以使ArrayedVec3实现Iterator,将其自身返回为next,或者在您希望易用性而不是效率的情况下进行各种其他操作。

但关键是如果你愿意自己管理这些适配器的创建和移动,你不需要担心拳击。您只需创建一次“框”,然后它就会跳转到您需要的任何位置。

如果你对C ++的2倍以内的性能感兴趣,并且目标是单线程使用,那么应该这样做。 (过去它对我有用。)