如何在python中拆分音频文件

时间:2017-04-04 10:20:03

标签: python-3.x audio speech-recognition aac pydub

我正致力于客户关怀数据的语音情感分析。我有一个音频文件,客户服务人员已经提出了问题并且客户已经对他进行了审查。

我需要拆分此音频,并从客户处获取评论部分,以进行情绪分析,无论客户是满意还是悲伤或中立。

请告诉我,如何拆分音频文件以仅获取客户的音频。音频的格式为“.aac”

到目前为止,这就是我所做的:

from os import path
AUDIO_FILE = path.join(path.dirname(path.realpath('C:\\Users\\anagha\\Documents\\Python Scripts')),"Python Scripts\\audioa.aac")

halfway_point = len(AUDIO_FILE) / 2

2 个答案:

答案 0 :(得分:3)

因为您使用了pydub标签,所以如何使用pydub

from pydub import AudioSegment
sound = AudioSegment.from_file(AUDIO_FILE)

halfway_point = len(sound) // 2
first_half = sound[:halfway_point]

# create a new file "first_half.mp3":
first_half.export("/path/to/first_half.mp3", format="mp3")

答案 1 :(得分:0)

我认为回答最初的问题为时已晚,但有人绊倒这个问题可能会发现程序有用

- >使用工具来分析数据。我使用过LIUM(http://www-lium.univ-lemans.fr/diarization/doku.php

- >根据这个非常简单的SO帖子(Parsing LIUM Speaker Diarization Output

来解释输出

然后最后使用从上面获得的时间来拼接音频文件!然而,将语音转换为文本是一个完全不同的挑战,需要深入的方法(拥有大量数据)或依赖API提供商(如谷歌)