Google Cloud语音转文本和Amazon Transcribe均提供punctuation和word timestamps。我可以获取标点符号时间戳吗?具体来说,我想要时间戳记(例如句点,问号,感叹号)的时间戳,例如0:33秒,1:01、1:23、1:49、2:05等。
我想我可以使用Google或AWS使用标点符号来转录文件,然后将其分解为句子,然后为每个句子做一个单词时间戳。如果我可以为getPunctuationTimestamps
设置参数,则会更容易(对于500句的文件,大约是计算机时间的1/500)。
IBM Watson语音转文本功能提供keyword spotting,但不提供标点符号。
答案 0 :(得分:0)
我尝试了IBM Watson Speech-to-Text的keyword spotting。我提供了一个48分钟的Radio Ambulante广播播客,该播客带有官方成绩单。这是用于高质量的NPR播客。我从笔录中选择了一个句子作为“关键词”。沃森花了大约48分钟来录制48分钟的播客。主持人的转录率高于90%,受访者的转录率高于80%。问题是要工作,我需要100%的准确性。例如,一位古巴医生说:“我想我,没有共产党员”(“我不认为自己是共产党员”),但沃森却听到了“ considerabacomúnesto”。沃森从未找到目标句子。