numpy数组和矩阵之间有什么区别?我应该使用哪一个?

时间:2010-11-11 03:25:10

标签: python arrays matrix numpy

每种方法的优点和缺点是什么?

从我所看到的情况来看,如果需要的话,任何一个都可以作为另一个的替代品,那么我是否应该使用它们或者我应该只坚持其中一个?

该计划的风格会影响我的选择吗?我正在使用numpy做一些机器学习,所以确实有很多矩阵,但也有很多向量(数组)。

5 个答案:

答案 0 :(得分:354)

Numpy矩阵是严格的二维矩阵,而numpy数组(ndarrays)是 N维。 Matrix对象是ndarray的子​​类,因此它们继承了所有 ndarrays的属性和方法。

numpy矩阵的主要优点是它们提供了方便的符号 对于矩阵乘法:如果a和b是矩阵,则a * b是它们的矩阵 产品

import numpy as np

a=np.mat('4 3; 2 1')
b=np.mat('1 2; 3 4')
print(a)
# [[4 3]
#  [2 1]]
print(b)
# [[1 2]
#  [3 4]]
print(a*b)
# [[13 20]
#  [ 5  8]]

另一方面,从Python 3.5开始,NumPy使用@运算符支持中缀矩阵乘法,因此您可以使用Python> = 3.5中的ndarrays实现矩阵乘法的相同方便。

import numpy as np

a=np.array([[4, 3], [2, 1]])
b=np.array([[1, 2], [3, 4]])
print(a@b)
# [[13 20]
#  [ 5  8]]

矩阵对象和ndarray都有.T来返回转置,但矩阵 对象也有.H用于共轭转置,而.I用于反向转换。

相比之下,numpy数组始终遵循操作规则 应用元素(新的@运算符除外)。因此,如果ab是numpy数组,那么a*b就是数组 通过元素乘以组件形成:

c=np.array([[4, 3], [2, 1]])
d=np.array([[1, 2], [3, 4]])
print(c*d)
# [[4 6]
#  [6 4]]

要获得矩阵乘法的结果,请使用np.dot(或Python中的@> = 3.5,如上所示):

print(np.dot(c,d))
# [[13 20]
#  [ 5  8]]

**运算符的行为也不同:

print(a**2)
# [[22 15]
#  [10  7]]
print(c**2)
# [[16  9]
#  [ 4  1]]

由于a是一个矩阵,a**2会返回矩阵乘积a*a。 由于c是一个ndarray,c**2返回一个ndarray,每个组件的平方 逐元素。

矩阵对象和ndarray之间还存在其他技术差异 (与np.ravel,项目选择和序列行为有关。)

numpy数组的主要优点是它们更通用 二维矩阵。当你想要一个三维数组时会发生什么?然后 你必须使用ndarray,而不是矩阵对象。因此,学习使用矩阵 对象更多的工作 - 你必须学习矩阵对象操作,和 ndarray的运作。

编写一个同时使用矩阵和数组的程序会让你的生活变得困难 因为你必须跟踪你的变量是什么类型的对象,以免 乘法返回你不期望的东西。

相比之下,如果你坚持使用ndarrays,那么你可以做任何事情 矩阵对象可以做多,除了略有不同 功能/符号。

如果您愿意放弃NumPy矩阵产品的视觉吸引力 符号(在Python中使用ndarrays可以很好地实现> = 3.5),然后我认为NumPy数组肯定是要走的路。

PS。当然,你真的不必以牺牲另一个为代价来选择一个, 因为np.asmatrixnp.asarray允许您将一个转换为另一个(作为 只要数组是二维的。)


NumPy arrays与NumPy matrix es here之间存在差异概要。

答案 1 :(得分:83)

Scipy.org recommends that you use arrays:

  

*'array'或'matrix'?我应该使用哪个? - 简短回答

     

使用数组。

     
      
  • 它们是numpy的标准矢量/矩阵/张量类型。许多numpy函数返回数组,而不是矩阵。

  •   
  • 元素操作和元素之间有明显的区别   线性代数运算。

  •   
  • 如果您愿意,可以使用标准向量或行/列向量。

  •   
     

使用数组类型的唯一缺点是你必须这样做   使用dot代替*来乘以(减少)两个张量(标量积,   矩阵向量乘法等。)。

答案 2 :(得分:27)

只需将一个案例添加到unutbu的列表中。

与numpy矩阵或matlab等矩阵语言相比,numpy ndarray的最大实际差异之一是,维度不会在reduce操作中保留。矩阵总是2d,而数组的平均值只有一个维度。

例如,矩阵或数组的demean行:

带矩阵

>>> m = np.mat([[1,2],[2,3]])
>>> m
matrix([[1, 2],
        [2, 3]])
>>> mm = m.mean(1)
>>> mm
matrix([[ 1.5],
        [ 2.5]])
>>> mm.shape
(2, 1)
>>> m - mm
matrix([[-0.5,  0.5],
        [-0.5,  0.5]])

with array

>>> a = np.array([[1,2],[2,3]])
>>> a
array([[1, 2],
       [2, 3]])
>>> am = a.mean(1)
>>> am.shape
(2,)
>>> am
array([ 1.5,  2.5])
>>> a - am #wrong
array([[-0.5, -0.5],
       [ 0.5,  0.5]])
>>> a - am[:, np.newaxis]  #right
array([[-0.5,  0.5],
       [-0.5,  0.5]])

我还认为混合数组和矩阵可以产生许多“快乐”的调试时间。 但是,scipy.sparse矩阵总是就乘法运算符而言是矩阵。

答案 3 :(得分:18)

正如其他人所提到的,也许matrix的主要优点是它为矩阵乘法提供了方便的符号。

但是,in Python 3.5 there is finally a dedicated infix operator for matrix multiplication@

使用最近的NumPy版本,它可以与ndarray s:

一起使用
A = numpy.ones((1, 3))
B = numpy.ones((3, 3))
A @ B

所以现在,甚至更多,如果有疑问,你应该坚持ndarray

答案 4 :(得分:11)

根据官方文档,不再建议使用矩阵类,因为将来会删除它。

https://numpy.org/doc/stable/reference/generated/numpy.matrix.html

其他答案已经表明您可以使用NumPy数组实现所有操作。