我正致力于客户关怀数据的语音情感分析。我有一个音频文件,客户服务人员已经提出了问题并且客户已经对他进行了审查。
我需要拆分此音频,并从客户处获取评论部分,以进行情绪分析,无论客户是满意还是悲伤或中立。
请告诉我,如何拆分音频文件以仅获取客户的音频。音频的格式为“.aac”
到目前为止,这就是我所做的:
from os import path
AUDIO_FILE = path.join(path.dirname(path.realpath('C:\\Users\\anagha\\Documents\\Python Scripts')),"Python Scripts\\audioa.aac")
halfway_point = len(AUDIO_FILE) / 2
答案 0 :(得分:3)
因为您使用了pydub标签,所以如何使用pydub
from pydub import AudioSegment
sound = AudioSegment.from_file(AUDIO_FILE)
halfway_point = len(sound) // 2
first_half = sound[:halfway_point]
# create a new file "first_half.mp3":
first_half.export("/path/to/first_half.mp3", format="mp3")
答案 1 :(得分:0)
我认为回答最初的问题为时已晚,但有人绊倒这个问题可能会发现程序有用
- >使用工具来分析数据。我使用过LIUM(http://www-lium.univ-lemans.fr/diarization/doku.php)
- >根据这个非常简单的SO帖子(Parsing LIUM Speaker Diarization Output)
来解释输出然后最后使用从上面获得的时间来拼接音频文件!然而,将语音转换为文本是一个完全不同的挑战,需要深入的方法(拥有大量数据)或依赖API提供商(如谷歌)