Question

我正在使用AWS Transcribe进行语音识别。尽管我已经创建了自定义词汇表，但是我找不到任何Boto3代码片段来在python中使用它。请找到附带的示例代码。

client_transcribe = boto3.client（'transcribe'） client_transcribe.start_transcription_job（TranscriptionJobName = job_name， Media = {'MediaFileUri'：file_url}，MediaFormat ='mp4'，LanguageCode ='en-US'，OutputBucketName = bucket）

Answer 1

词汇名称是设置对象的成员，它是start_transcription_job方法的参数。

参考：https://boto3.amazonaws.com/v1/documentation/api/latest/reference/services/transcribe.html#TranscribeService.Client.start_transcription_job

示例：

settings = {
    'VocabularyName': 'your-custom-vocabulary-name-goes-here'
}

client_transcribe.start_transcription_job(
    TranscriptionJobName=job_name,
    LanguageCode='your-language-code-goes-here',
    Settings=settings,
    MediaFormat='mp4',
    OutputBucketName=bucket
    Media={
        'MediaFileUri': file_url
    })

如果您需要帮助来确定词汇表的语言代码，如果您已安装AWS cli，则可以从终端使用以下AWS cli命令：

aws transcribe get-vocabulary --vocabulary-name {your-custom-vocabulary-name}

它返回一个响应，例如：

{
  "LastModifiedTime": 1573523589.419,
  "VocabularyName": "redacted",
  "DownloadUri": "redacted",
  "LanguageCode": "en-US",
  "VocabularyState": "READY"
}

例如，如果您的词汇表的语言代码为en-US，则在呼叫start_transcription_job时使用该语言代码。

希望这会有所帮助！

AWS Transcribe，无法找到任何Boto3代码片段以利用自定义词汇表

1 个答案: