使用PyAudio进行流式处理时修改音量

时间:2016-04-16 12:22:33

标签: python wav pyaudio

我正在尝试流式传输.WAV文件,同时剥离其中一个声道,因此它只能在一个扬声器上播放,同时减小音量。

我使用PyAudio的原因是我必须能够

  • 一次流式传输多个文件
  • 播放特定扬声器的声音(左/右)
  • 中断播放声音文件

并且无法找到允许这些功能的任何其他python库。

我有以下代码,从PyAudio的流媒体示例中修改。它播放一个扬声器的WAV文件,但我无法找到以任何方式修改音量的方法。

"""PyAudio Example: Play a wave file."""

import pyaudio
import wave
import sys 

CHUNK = 1024

if len(sys.argv) < 2:
    print("Plays a wave file.\n\nUsage: %s filename.wav" % sys.argv[0])
    sys.exit(-1)

wf = wave.open(sys.argv[1], 'rb')

# instantiate PyAudio (1)
p = pyaudio.PyAudio()

# open stream (2)
sampwidth = wf.getsampwidth()
stream = p.open(format=p.get_format_from_width(sampwidth),
                channels=wf.getnchannels(),
                rate=wf.getframerate(),
                output=True)

# read data
data = bytearray(wf.readframes(CHUNK))

# play stream (3)
while len(data) > 0:
    #remove left channel
    for i in range(0, len(data)):
        if i % (sampwidth*2) < sampwidth:
            data[i] = 0

    #reduce volume by 50%
    for i in range(0, len(data)):
        # use magic???
        pass

    stream.write(bytes(data))
    data = wf.readframes(CHUNK)
    if len(data) > 0:
        data = bytearray(data)

# stop stream (4)
stream.stop_stream()
stream.close()

# close PyAudio (5)
p.terminate()

如果有人能给我任何指示,我将不胜感激。我觉得答案需要更好地理解WAV文件的格式,而不是我目前拥有的格式。我试过data[i] = int(data[i]/2)和其他类似的简单算术,但输出只是扭曲,这表明WAV文件格式并不像我想象的那么简单。

3 个答案:

答案 0 :(得分:1)

您可以使用subprocess模块:

来自subprocess导入电话

 call(["amixer", "-D", "pulse", "sset", "Master", "0%"])

将音量增加10%:

call(["amixer", "-D", "pulse", "sset", "Master", "10%+"])

将音量降低10%:

call(["amixer", "-D", "pulse", "sset", "Master", "10%-"])

答案 1 :(得分:0)

您可能想要结帐pydub。它使用pyaudio并有一个简单的方法来改变音量。

答案 2 :(得分:0)

您可以使用numpy来执行此操作,而无需调用子进程。代码示例:

import numpy

def audio_datalist_set_volume(datalist, volume):
    """ Change value of list of audio chunks """
    sound_level = (volume / 100.)

    for i in range(len(datalist)):
        chunk = numpy.fromstring(datalist[i], numpy.int16)

        chunk = chunk * sound_level

        datalist[i] = chunk.astype(numpy.int16)

注意:datalist是您的声音阵列

要使用它,只需将声音数据传递给该功能并设置音量即可。