我有1000多个小时的采访音频文件。为了进行研究,我需要抄录它们(#Audio-transcription),我支付不了很多,而且我还需要很高的准确性。根据我的搜索,我可以使用GCP,Azure,AWS,IBM等云服务,也可以编写应用程序(例如C#)并使用其API。或者,我可以使用.NET语音识别库。另外,似乎也有一些开源平台。但是总的来说,这些解决方案使我很困惑。最好的解决方案是什么?
答案 0 :(得分:0)
我认为现实上您至少需要支付某事,或者只是冒着转录可能会出错的事实的风险。这是我很快找到的便宜的happyscribe。
否则,另一种选择可能是使用oTranscribe之类的开源选项(只需下载所有js并在本地运行网站)。
您提到使用云服务,但这仅用于运行基于机器学习(ML)的程序吗?在这种情况下,您必须首先创建/使用TensorFlow或类似的基于程序的语音识别功能,这本身就是一项技巧(如果您之前没有做过ML)。
我确定您会在那儿找到语音识别库(one example),但是您可以自行实现自定义方式并自行运行训练模型。
我个人认为,获得自定义的转录器功能没有错误需要花很长时间,并且要花1000个小时才能高速运行。
答案 1 :(得分:0)
我对解决方案感到非常困惑。但是,似乎最佳的解决方案是在我的软件中使用Google Speech API或Microsoft Speech API。 我只需要这样的结果。但是据我了解,如果仅将Google Cloud完全用于此转换,则与仅使用其API相比,它的成本更高(但我不确定。是真的吗?)