numpy:np.abs到底是如何工作的?

时间:2019-02-26 09:26:02

标签: numpy go implementation absolute

我正在尝试为Go中的gonum密集向量实现自己的绝对函数。我想知道是否有比平方和平方根更好的方法来获取数组的绝对值?

我的主要问题是我必须在这些向量上实现自己的元素明智的牛顿平方根函数,并且实现速度和准确性之间要取得平衡。如果我可以避免使用平方根函数,那我会很高兴的。

1 个答案:

答案 0 :(得分:2)

NumPy源代码可能很难导航,因为它具有用于许多数据类型的众多功能。您可以在文件scalarmath.c.src中找到绝对值函数的C级源代码。该文件实际上是具有功能定义的模板,该功能定义随后由构建系统针对几种数据类型进行复制。请注意,每个函数都是为数组的每个元素运行的“内核”(遍历数组的操作在其他地方完成)。这些函数始终称为<name of the type>_ctype_absolute,其中<name of the type>是它应用于的数据类型,通常是模板化的。让我们来看看它们。

/**begin repeat
 * #name = ubyte, ushort, uint, ulong, ulonglong#
 */

#define @name@_ctype_absolute @name@_ctype_positive

/**end repeat**/

这是无符号类型的。在这种情况下,绝对值与np.positive相同,后者仅复制该值而不执行任何操作(如果您拥有数组a并且执行+a,则得到的是绝对值)

/**begin repeat
 * #name = byte, short, int, long, longlong#
 * #type = npy_byte, npy_short, npy_int, npy_long, npy_longlong#
 */
static void
@name@_ctype_absolute(@type@ a, @type@ *out)
{
    *out = (a < 0 ? -a : a);
}
/**end repeat**/

这个是有符号整数。非常简单。

/**begin repeat
 * #name = float, double, longdouble#
 * #type = npy_float, npy_double, npy_longdouble#
 * #c = f,,l#
 */
static void
@name@_ctype_absolute(@type@ a, @type@ *out)
{
    *out = npy_fabs@c@(a);
}
/**end repeat**/

这是浮点值。这里使用npy_fabsfnpy_fabsnpy_fabsl函数。它们在npy_math.h中声明,但通过npy_math_internal.h.src中的模板C代码定义,本质上调用C/C99 counterparts(除非C99不可用,in which case fabsf and fabsl are emulated with fabs)。您可能会认为前面的代码对于浮点类型也应该适用,但实际上它们更复杂,因为它们具有NaN,无穷大或有符号零之类的东西,因此最好使用处理所有内容的标准C函数。可靠地。

static void
half_ctype_absolute(npy_half a, npy_half *out)
{
    *out = a&0x7fffu;
}

这实际上不是模板,它是half-precision floating-point values的绝对值函数。事实证明,您可以通过按位操作(将第一位设置为0)来更改符号,因为半精度比其他浮点类型更简单(如果有更多限制)(对于那些浮点类型通常相同,但是有特殊情况) )。

/**begin repeat
 * #name = cfloat, cdouble, clongdouble#
 * #type = npy_cfloat, npy_cdouble, npy_clongdouble#
 * #rtype = npy_float, npy_double, npy_longdouble#
 * #c = f,,l#
 */
static void
@name@_ctype_absolute(@type@ a, @rtype@ *out)
{
    *out = npy_cabs@c@(a);
}
/**end repeat**/

最后一个是针对复杂类型的。它们使用npy_cabsfnpycabsnpy_cabsl函数,它们再次在npy_math.h中声明,但在这种情况下,模板是在npy_math_complex.c.src中使用C99 functions实现的(除非则无法使用,在这种情况下为emulated with np.hypot)。