Question

我有一个音频文件，其中包含电子邮件，电话号码等信息。我想删除此类信息而不会丢失原始语音。

我对python使用了以下方法：

首先，我将音频转换为文本，然后将其删除信息，然后再次将其转换为音频。
这样，我失去了那个人的原始声音。

我有什么办法可以做到这一点而又不会失去原有的声音？这是我使用azure API将音频转换为文本的代码。

def stream_audio_file(speech_file, chunk_size=1024):
    # chunk audio file
    with open(speech_file, 'rb') as f:
        while 1:
            data = f.read(1024)
            if not data:
                break
            yield data

如何在不丢失原始语音的情况下从音频中删除一些信息？

Answer 1

从识别器获取单词时间戳记，并在所需的时间段删除信号。选中"AddWordLevelTimestamps"配置选项。

有什么方法可以从音频文件（.wav）中删除某些关键字，例如电子邮件和电话号码，而无需将其转换为文本？

1 个答案: