标签: machine-learning image-processing deep-learning nlp conv-neural-network
我正在研究一个必须匹配(文本,图像)对的问题陈述。给定家具描述和家具形象,我必须说它们相同或不同。这是一个二进制分类问题,但是我必须将文本和图像数据都结合起来。 我正在尝试的一种可能的解决方案如下 在上图中,我正在组合来自预训练的文本和图像模型的功能,并从头到尾训练线性层。
是否有其他方法可以处理此类问题。任何线索都是最欢迎的。在此先感谢您的帮助。
答案 0 :(得分:0)
我得到了一些有关“图文匹配” 的问题的最新著作,该问题与我的问题陈述稍有不同,但是我可以为项目调整代码。