有什么方法可以从音频文件(.wav)中删除某些关键字,例如电子邮件和电话号码,而无需将其转换为文本?

时间:2019-06-25 06:33:31

标签: azure speech-recognition

我有一个音频文件,其中包含电子邮件,电话号码等信息。我想删除此类信息而不会丢失原始语音。

我对python使用了以下方法:

  1. 首先,我将音频转换为文本,然后将其删除 信息,然后再次将其转换为音频。
  2. 这样,我失去了那个人的原始声音。

我有什么办法可以做到这一点而又不会失去原有的声音? 这是我使用azure API将音频转换为文本的代码。

def stream_audio_file(speech_file, chunk_size=1024):
    # chunk audio file
    with open(speech_file, 'rb') as f:
        while 1:
            data = f.read(1024)
            if not data:
                break
            yield data

如何在不丢失原始语音的情况下从音频中删除一些信息?

1 个答案:

答案 0 :(得分:0)

从识别器获取单词时间戳记,并在所需的时间段删除信号。选中"AddWordLevelTimestamps"配置选项。