如何将Amazon Transcribe json响应转换为标题格式(srt,webvvt等)?

时间:2018-01-31 16:59:51

标签: json amazon-web-services speech-to-text webvtt

尝试查找从Amazon AWS Transcribe服务转换我的json响应的包,但没有运气。

您可以看到an example of the JSON in the JavaScript part of the Fiddle

我不想采取天真的做法,只是"捆绑"像10个单词一样,因为这将以奇怪的方式隔离字幕。

我甚至接受使用Google语音服务或语音信息的程序化方式。它们都返回一个按字母细分的json文件。

之前有人使用过吗?

谢谢!

9 个答案:

答案 0 :(得分:3)

您可能已经找到了一种方法或创建了一个脚本。我还尝试寻找一些现成的解决方案,因此最终编写了一些JavaScript代码以从Amazon Transcribe的JSON输出生成SRT。

https://www.yash.info/aws-srt-creator.htm

我在句号(。)违反句子。这是一个独立的HTML文件。随时根据需要免费下载和修改。

答案 1 :(得分:0)

There is something here (aws-transcribe-to-vtt)但我还没能测试它......

答案 2 :(得分:0)

我遇到了这个答案,并且还在一段时间内,通过使用其他一些链接中显示的一些信息来寻找它-接近了我可以使用的内容,但并没有找到确切的答案答案,我决定完成解决方案。

第1步-获取HTML模板以处理文本块和扬声器名称,并按按钮以处理javascript 步骤2-将从Aws接收到的json粘贴到文本块中 第3步-单击该按钮。

HTML页面可在此处找到:https://js.do/lnortje_gmail-com/amazon-transcribe-to-html-converter

我发现有用的一件事是了解翻译的可信度-使用它有助于了解翻译中可能存在的问题,并显示译文的确切时间,使您可以录音的那个地方。

好吧,使用它并享受它,有一天可能会帮助某人:)

答案 3 :(得分:0)

这是一个简单的实用程序脚本,我发现它可以将Amazon Transcribe .json成绩单转换为更具可读性的成绩单

https://github.com/purdy/aws-transcribe-transcript

答案 4 :(得分:0)

这是您可能可以使用的要点。或让您了解所需的内容。 基本上,我最终要做什么。 https://gist.github.com/mwleinad/67a39d7d723f0a2ed076ed2485e098ae

答案 5 :(得分:0)

我从github使用了这个python脚本,它确实很好地格式化为docx格式。输出甚至包括单词置信度级别的散点图,以及将颜色更改为较低置信度的单词。

https://github.com/kibaffo33/aws_transcribe_to_docx

这对我来说确实很好,但是我想如果您想更改python脚本,可以很简单地将其转到html。

答案 6 :(得分:0)

我最终创建了一个Bash脚本,将AWS Transcribe JSON文件转换为SRT。

它使用'jq'解析JSON文件。

https://github.com/nicolasps/aws-transcribe-to-srt

答案 7 :(得分:0)

yash answer的启发,我接受了它并做了一些小的改动。随时使用它。

https://apoorv.blog/aws-transcribe-json-to-srt.html

我个人出于个人目的使用此工具,因此希望保持最新状态。

答案 8 :(得分:0)

我为此目的构建了一个网络应用程序(查看和编辑 aws 转录 JSON 文件):https://scription.app

它将扬声器分开,突出显示可信度低的词并将文本链接到音频播放(如果您加载音频文件)。它仍然是一个测试版,但希望对看到这篇文章的人有所帮助!