尝试查找从Amazon AWS Transcribe服务转换我的json响应的包,但没有运气。
您可以看到an example of the JSON
in the JavaScript part of the Fiddle。
我不想采取天真的做法,只是"捆绑"像10个单词一样,因为这将以奇怪的方式隔离字幕。
我甚至接受使用Google语音服务或语音信息的程序化方式。它们都返回一个按字母细分的json文件。
之前有人使用过吗?
谢谢!
答案 0 :(得分:3)
您可能已经找到了一种方法或创建了一个脚本。我还尝试寻找一些现成的解决方案,因此最终编写了一些JavaScript代码以从Amazon Transcribe的JSON输出生成SRT。
https://www.yash.info/aws-srt-creator.htm
我在句号(。)违反句子。这是一个独立的HTML文件。随时根据需要免费下载和修改。
答案 1 :(得分:0)
There is something here (aws-transcribe-to-vtt
)但我还没能测试它......
答案 2 :(得分:0)
我遇到了这个答案,并且还在一段时间内,通过使用其他一些链接中显示的一些信息来寻找它-接近了我可以使用的内容,但并没有找到确切的答案答案,我决定完成解决方案。
第1步-获取HTML模板以处理文本块和扬声器名称,并按按钮以处理javascript 步骤2-将从Aws接收到的json粘贴到文本块中 第3步-单击该按钮。
HTML页面可在此处找到:https://js.do/lnortje_gmail-com/amazon-transcribe-to-html-converter
我发现有用的一件事是了解翻译的可信度-使用它有助于了解翻译中可能存在的问题,并显示译文的确切时间,使您可以录音的那个地方。
好吧,使用它并享受它,有一天可能会帮助某人:)
答案 3 :(得分:0)
这是一个简单的实用程序脚本,我发现它可以将Amazon Transcribe .json成绩单转换为更具可读性的成绩单
答案 4 :(得分:0)
这是您可能可以使用的要点。或让您了解所需的内容。 基本上,我最终要做什么。 https://gist.github.com/mwleinad/67a39d7d723f0a2ed076ed2485e098ae
答案 5 :(得分:0)
我从github使用了这个python脚本,它确实很好地格式化为docx格式。输出甚至包括单词置信度级别的散点图,以及将颜色更改为较低置信度的单词。
https://github.com/kibaffo33/aws_transcribe_to_docx
这对我来说确实很好,但是我想如果您想更改python脚本,可以很简单地将其转到html。
答案 6 :(得分:0)
我最终创建了一个Bash脚本,将AWS Transcribe JSON文件转换为SRT。
它使用'jq'解析JSON文件。
答案 7 :(得分:0)
受yash answer的启发,我接受了它并做了一些小的改动。随时使用它。
https://apoorv.blog/aws-transcribe-json-to-srt.html
我个人出于个人目的使用此工具,因此希望保持最新状态。
答案 8 :(得分:0)
我为此目的构建了一个网络应用程序(查看和编辑 aws 转录 JSON 文件):https://scription.app
它将扬声器分开,突出显示可信度低的词并将文本链接到音频播放(如果您加载音频文件)。它仍然是一个测试版,但希望对看到这篇文章的人有所帮助!