语音转文本标点时间戳?

时间:2019-06-20 21:59:59

标签: ibm-watson speech-to-text google-speech-api aws-transcribe

Google Cloud语音转文本和Amazon Transcribe均提供punctuationword timestamps。我可以获取标点符号时间戳吗?具体来说,我想要时间戳记(例如句点,问号,感叹号)的时间戳,例如0:33秒,1:01、1:23、1:49、2:05等。

我想我可以使用Google或AWS使用标点符号来转录文件,然后将其分解为句子,然后为每个句子做一个单词时间戳。如果我可以为getPunctuationTimestamps设置参数,则会更容易(对于500句的文件,大约是计算机时间的1/500)。

IBM Watson语音转文本功能提供keyword spotting,但不提供标点符号。

1 个答案:

答案 0 :(得分:0)

我尝试了IBM Watson Speech-to-Text的keyword spotting。我提供了一个48分钟的Radio Ambulante广播播客,该播客带有官方成绩单。这是用于高质量的NPR播客。我从笔录中选择了一个句子作为“关键词”。沃森花了大约48分钟来录制48分钟的播客。主持人的转录率高于90%,受访者的转录率高于80%。问题是要工作,我需要100%的准确性。例如,一位古巴医生说:“我想我,没有共产党员”(“我不认为自己是共产党员”),但沃森却听到了“ considerabacomúnesto”。沃森从未找到目标句子。