文字图像组合分类模型

时间:2020-05-11 01:49:38

标签: machine-learning image-processing deep-learning nlp conv-neural-network

我正在研究一个必须匹配(文本,图像)对的问题陈述。给定家具描述和家具形象,我必须说它们相同或不同。这是一个二进制分类问题,但是我必须将文本和图像数据都结合起来。 我正在尝试的一种可能的解决方案如下 enter image description here 在上图中,我正在组合来自预训练的文本和图像模型的功能,并从头到尾训练线性层。

是否有其他方法可以处理此类问题。任何线索都是最欢迎的。在此先感谢您的帮助。

1 个答案:

答案 0 :(得分:0)

我得到了一些有关“图文匹配” 的问题的最新著作,该问题与我的问题陈述稍有不同,但是我可以为项目调整代码。

  1. 用于图像文本匹配和检索enter link description here的变压器推理网络
  2. 用于图像-文本匹配enter link description here的堆叠式交叉注意