Tensorflow是否有全面的CTC损失示例? tensorflow.contrib.ctc
的文档不包含我的足够信息。我知道有一个Stackoverflow post,但我无法解决这个问题。
也许某人有一个完整的(双向)LSTM示例,其中包含他/她可以共享的样本数据。感谢。
答案 0 :(得分:3)
有关双向LSTM和CTC实施的示例,请参阅here,在TIMIT语料库上训练音素识别模型。如果您无法访问TIMIT或其他音素转录数据集,您可能无法通过这样的单层模型获得任何不错的性能,但基本结构应保持不变。
更新:如果您无法访问TIMIT,或者您只是希望在没有格式化输入的情况下看到该项运行以使代码生效,我已添加了8个样本的玩具数据集,您可以过度使用以查看正在进行的培训。
答案 1 :(得分:1)
您是否看过CTC的单元测试?请参阅ctc_loss测试和ctc_decoder测试。
这些包含的用法示例可以帮助您进一步了解如何使用操作。
答案 2 :(得分:0)
Chris Dinanth 为用于语音识别的 CTC 和 RNN 提供了一个很好的例子。他的模型使用音素识别语音。使用的 CTC 损失是 tf.keras.backend.ctc_batch_cost。
代码位于 https://github.com/chrisdinant/speech 可以在 https://towardsdatascience.com/kaggle-tensorflow-speech-recognition-challenge-b46a3bca2501
找到对已完成操作的详细解释