喀拉拉邦的张量点积

时间:2019-07-17 18:37:43

标签: python keras tensor dot-product

我是keras的新手,在了解keras.layers.Dot()层时遇到了一些问题。

我正在尝试计算两个向量的点积。

from keras.layers import Input, Dot
from keras.models import Model
import numpy as np

x1 = Input(shape=(4,))
x2 = Input(shape=(4,))
y1 = Dot(axes=1)([x1,x2])
model = Model(inputs=[x1, x2], outputs=y1)

a1 = np.arange(4)
a2=np.arange(4)
model.predict([a1,a2])

我希望输出为14 = 0 + 1 ^ 2 + 2 ^ 2 + 3 ^ 2。但是,我收到如下错误消息:

ValueError: Error when checking input: expected input_46 to have shape (4,) but got array with shape (1,)

我尝试运行model.get_config(),以下是有关模型图的相应信息。如您所见,input_46是x1,input_47是x2。

{'name': 'model_19',
 'layers': [{'name': 'input_46',
   'class_name': 'InputLayer',
   'config': {'batch_input_shape': (None, 4),
    'dtype': 'float32',
    'sparse': False,
    'name': 'input_46'},
   'inbound_nodes': []},
  {'name': 'input_47',
   'class_name': 'InputLayer',
   'config': {'batch_input_shape': (None, 4),
    'dtype': 'float32',
    'sparse': False,
    'name': 'input_47'},
   'inbound_nodes': []},
  {'name': 'dot_20',
   'class_name': 'Dot',
   'config': {'name': 'dot_20',
    'trainable': True,
    'axes': 1,
    'normalize': False},
   'inbound_nodes': [[['input_46', 0, 0, {}], ['input_47', 0, 0, {}]]]}],
 'input_layers': [['input_46', 0, 0], ['input_47', 0, 0]],
 'output_layers': [['dot_20', 0, 0]]}

我有没有做对的事情?谢谢!

更新

以下代码有效:

x1 = Input(shape=(4,))
x2 = Input(shape=(4,))
y1 = Dot(axes=1)([x1,x2])
model = Model(inputs=[x1, x2], outputs=y1)
a1 = np.arange(4).reshape(1,4)
a2=np.arange(4).reshape(1,4)
model.predict([a1,a2])

from keras.layers import Input, Dot
from keras.models import Model
import numpy as np

x1 = Input(shape=(4,))
x2 = Input(shape=(4,))
y1 = Dot(axes=1)([x1,x2])
model = Model(inputs=[x1, x2], outputs=y1)

a1 = np.arange(4)
a2=np.arange(4)
model.predict([[a1],[a2]]) 

1 个答案:

答案 0 :(得分:1)

Keras等待获取一批输入。如果您有N个尺寸为4的输入,则类似于大小为N * 4的矢量。因此,如果要发送单个矢量,则尺寸应为1 * 4而不是4。 因此,您有两种选择:

  1. 更改

    a1 = np.arange(4) a2 = np.arange(4)

收件人

a1 = np.arange(1,4)
a2=np.arange(1,4)
  1. 或尝试model.predict([[a1],[a2]])。应该可以解决您的问题。