应用错误收集

音频转录

时间：2018-07-23 01:37:38

标签： voice-recognition transcription

我有1000多个小时的采访音频文件。为了进行研究，我需要抄录它们（＃Audio-transcription），我支付不了很多，而且我还需要很高的准确性。根据我的搜索，我可以使用GCP，Azure，AWS，IBM等云服务，也可以编写应用程序（例如C＃）并使用其API。或者，我可以使用.NET语音识别库。另外，似乎也有一些开源平台。但是总的来说，这些解决方案使我很困惑。最好的解决方案是什么？

2 个答案:

答案 0 :(得分：0)

我认为现实上您至少需要支付某事，或者只是冒着转录可能会出错的事实的风险。这是我很快找到的便宜的happyscribe。

否则，另一种选择可能是使用oTranscribe之类的开源选项（只需下载所有js并在本地运行网站）。

您提到使用云服务，但这仅用于运行基于机器学习（ML）的程序吗？在这种情况下，您必须首先创建/使用TensorFlow或类似的基于程序的语音识别功能，这本身就是一项技巧（如果您之前没有做过ML）。

我确定您会在那儿找到语音识别库（one example），但是您可以自行实现自定义方式并自行运行训练模型。

我个人认为，获得自定义的转录器功能没有错误需要花很长时间，并且要花1000个小时才能高速运行。

答案 1 :(得分：0)

我对解决方案感到非常困惑。但是，似乎最佳的解决方案是在我的软件中使用Google Speech API或Microsoft Speech API。我只需要这样的结果。但是据我了解，如果仅将Google Cloud完全用于此转换，则与仅使用其API相比，它的成本更高（但我不确定。是真的吗？）