用Python沉默后在PCM WAV文件中查找索引

时间:2011-03-09 19:05:11

标签: python audio indexing wav

我需要能够在暂停(静音)后立即找到WAV段的索引,最好是以毫秒为单位。我将使用此索引来指示在前一句话暂停后新语句的语音开始位置。我可以提供两到三秒的片段,其中包含双方的暂停和语音。

我已经看过如何打开和保存文件的Python Wave,但是我不确定如何在相对沉默之后找到第一个声音并获得索引。

更新

我的目的是索引圣经经文,以便用户可以选择任何一节经文并听到它的阅读。一旦找到第一个声音提示的索引,我就会将它备份几十毫秒以获得潜在客户。

由于

1 个答案:

答案 0 :(得分:0)

我在我的应用程序中使用过一次,但是我从SO中复制/粘贴了它。感谢编写它的人;)

import wave

handle = wave.open('file', 'r')

for i in range(handle.getnframes()):
  frame = handle.readframes(i)

  zero = True

  for j in range(len(frame)):
    if ord(frame[j]) > 0:
      zero = False
      break

    if zero:
      print 'Silence found at frame {0}'.format(handle.tell())