我正在使用AWS Transcribe进行语音识别。尽管我已经创建了自定义词汇表,但是我找不到任何Boto3代码片段来在python中使用它。请找到附带的示例代码。
client_transcribe = boto3.client('transcribe') client_transcribe.start_transcription_job(TranscriptionJobName = job_name, Media = {'MediaFileUri':file_url},MediaFormat ='mp4',LanguageCode ='en-US',OutputBucketName = bucket)
答案 0 :(得分:0)
词汇名称是设置对象的成员,它是start_transcription_job方法的参数。
示例:
settings = {
'VocabularyName': 'your-custom-vocabulary-name-goes-here'
}
client_transcribe.start_transcription_job(
TranscriptionJobName=job_name,
LanguageCode='your-language-code-goes-here',
Settings=settings,
MediaFormat='mp4',
OutputBucketName=bucket
Media={
'MediaFileUri': file_url
})
如果您需要帮助来确定词汇表的语言代码,如果您已安装AWS cli,则可以从终端使用以下AWS cli命令:
aws transcribe get-vocabulary --vocabulary-name {your-custom-vocabulary-name}
它返回一个响应,例如:
{
"LastModifiedTime": 1573523589.419,
"VocabularyName": "redacted",
"DownloadUri": "redacted",
"LanguageCode": "en-US",
"VocabularyState": "READY"
}
例如,如果您的词汇表的语言代码为en-US
,则在呼叫start_transcription_job
时使用该语言代码。
希望这会有所帮助!