应用错误收集

CNN中的反向传播如何用于文本分类中的预训练嵌入

时间：2019-03-26 14:25:56

标签： conv-neural-network word2vec pre-trained-model

在预训练word2vec嵌入的情况下，损失函数如何工作，因为在训练过程中权重未更新。那么反向传递如何工作以及如何更新以进行预测？

1 个答案:

答案 0 :(得分：0)

损失是对概率输出和实际类别的计算，该计算不依赖于任何后续层的训练状态。按状态，我的意思是 trainable == True 或 trainable == False 。

仅当状态为 trainable == True 时，损耗的反向传播才与学习速率结合使用来调整层的权重。如果在不可训练层之间存在可训练层，则错误仍然可以通过这些层。每个训练步骤之后，模型中任何可训练的图层都会更新。

使用Word2Vec时，权重将导入到嵌入层中，并且许多次被“冻结”，以便在训练其余参数时不会更新。但是，在此过程快要结束时，有时解冻这些砝码可以得到更好的结果。

相关问题

使用预训练（Tensorflow）CNN

使用预训练（Tensorflow）CNN对图像进行分类

FastText使用预先训练的单词向量进行文本分类

来自预先训练的InceptionV3 CNN的随机结果

CNN反向传播数值示例

特征列预训练嵌入

使用预先训练的单词嵌入对文档进行排名

预训练的“ CNN”模型用于“头部姿势”检测

CNN中的反向传播如何用于文本分类中的预训练嵌入

使用预训练的BERT模型进行错误的多类文本分类

最新问题

我写了这段代码，但我无法理解我的错误

我无法从一个代码实例的列表中删除 None 值，但我可以在另一个实例中。为什么它适用于一个细分市场而不适用于另一个细分市场？

是否有可能使 loadstring 不可能等于打印？卢阿

java中的random.expovariate()

Appscript 通过会议在 Google 日历中发送电子邮件和创建活动

为什么我的 Onclick 箭头功能在 React 中不起作用？

在此代码中是否有使用“this”的替代方法？

在 SQL Server 和 PostgreSQL 上查询，我如何从第一个表获得第二个表的可视化

每千个数字得到

更新了城市边界 KML 文件的来源？