Question

我正致力于客户关怀数据的语音情感分析。我有一个音频文件，客户服务人员已经提出了问题并且客户已经对他进行了审查。

我需要拆分此音频，并从客户处获取评论部分，以进行情绪分析，无论客户是满意还是悲伤或中立。

请告诉我，如何拆分音频文件以仅获取客户的音频。音频的格式为“.aac”

到目前为止，这就是我所做的：

from os import path
AUDIO_FILE = path.join(path.dirname(path.realpath('C:\\Users\\anagha\\Documents\\Python Scripts')),"Python Scripts\\audioa.aac")

halfway_point = len(AUDIO_FILE) / 2

Answer 1

因为您使用了pydub标签，所以如何使用pydub

from pydub import AudioSegment
sound = AudioSegment.from_file(AUDIO_FILE)

halfway_point = len(sound) // 2
first_half = sound[:halfway_point]

# create a new file "first_half.mp3":
first_half.export("/path/to/first_half.mp3", format="mp3")

Answer 2

我认为回答最初的问题为时已晚，但有人绊倒这个问题可能会发现程序有用

- ＆GT;使用工具来分析数据。我使用过LIUM（http://www-lium.univ-lemans.fr/diarization/doku.php）

- ＆GT;根据这个非常简单的SO帖子（Parsing LIUM Speaker Diarization Output）

来解释输出

然后最后使用从上面获得的时间来拼接音频文件！然而，将语音转换为文本是一个完全不同的挑战，需要深入的方法（拥有大量数据）或依赖API提供商（如谷歌）

如何在python中拆分音频文件

2 个答案: