我已经在网上找到了很多在iOS上使用音频的例子,但是大多数都已经过时了,并不适用于我想要完成的事情。这是我的项目:
我需要从两个来源捕获音频样本 - 麦克风输入和存储的音频文件。我需要对这些样本执行FFT以生成"指纹"对于整个剪辑,以及应用一些额外的过滤器。最终目标是建立一种类似于Shazam等的歌曲识别软件。
在iOS 8中捕获单个音频样本以执行快速傅立叶变换的最佳方法是什么?我想最终会有大量的这些,但我怀疑它可能不会像那样。其次,如何使用Accelerate框架处理音频?这似乎是在iOS中对音频执行复杂分析的最有效方式。
我在网上看到的所有示例都使用旧版本的iOS和Objective-C,但我还没能成功将它们转换为Swift。 iOS 8是否为此类事物提供了一些新的框架?
答案 0 :(得分:9)
在iOS中录制:
AVAudioRecorder
的实例,如var audioRecorder: AVAudioRecorder? = nil
AVAudioRecorder
以存储示例和一些记录设置录制会话顺序:
prepareToRecord()
record()
stop()
完成Swift / AVAudioRecorder示例
录音方法的核心是:
func record() {
self.prepareToRecord()
if let recorder = self.audioRecorder {
recorder.record()
}
}
要准备录音(流式传输到file
),您可以:
func prepareToRecord() {
var error: NSError?
let documentsPath = NSSearchPathForDirectoriesInDomains(.DocumentDirectory, .UserDomainMask, true)[0] as! NSString
let soundFileURL: NSURL? = NSURL.fileURLWithPath("\(documentsPath)/recording.caf")
self.audioRecorder = AVAudioRecorder(URL: soundFileURL, settings: recordSettings as [NSObject : AnyObject], error: &error)
if let recorder = self.audioRecorder {
recorder.prepareToRecord()
}
}
最后,要停止录制,请使用:
func stopRecording() {
if let recorder = self.audioRecorder {
recorder.stop()
}
}
上面的示例还需要import AVFoundation
和一些recordSettings
,您可以选择。 recordSettings
的示例可能如下所示:
let recordSettings = [
AVFormatIDKey: kAudioFormatAppleLossless,
AVEncoderAudioQualityKey : AVAudioQuality.Max.rawValue,
AVEncoderBitRateKey : 320000,
AVNumberOfChannelsKey: 2,
AVSampleRateKey : 44100.0
]
这样做,你已经完成了。
您可能还想查看this Stack Overflow answer,其中包含demo project。
答案 1 :(得分:5)
AVAudioEngine是实现这一目标的方法。来自Apple的文档:
- 要播放和录制单曲,请使用AVAudioPlayer和AVAudioRecorder。
- 对于更复杂的音频处理,请使用AVAudioEngine。 AVAudioEngine包括用于音频输入和输出的AVAudioInputNode和AVAudioOutputNode。您还可以使用AVAudioNode对象处理和混合音频效果
我会直截了当地说:AVAudioEngine是一个非常挑剔的API,带有模糊的文档,很少有用的错误消息,几乎没有在线代码示例演示超过最基本的任务。 但是如果你花时间来克服小的学习曲线,你可以相对容易地做一些神奇的事情。
我建造了一个简单的游乐场"视图控制器,演示串联工作的麦克风和音频文件采样:
import UIKit
class AudioEnginePlaygroundViewController: UIViewController {
private var audioEngine: AVAudioEngine!
private var mic: AVAudioInputNode!
private var micTapped = false
override func viewDidLoad() {
super.viewDidLoad()
configureAudioSession()
audioEngine = AVAudioEngine()
mic = audioEngine.inputNode!
}
static func getController() -> AudioEnginePlaygroundViewController {
let me = AudioEnginePlaygroundViewController(nibName: "AudioEnginePlaygroundViewController", bundle: nil)
return me
}
@IBAction func toggleMicTap(_ sender: Any) {
if micTapped {
mic.removeTap(onBus: 0)
micTapped = false
return
}
let micFormat = mic.inputFormat(forBus: 0)
mic.installTap(onBus: 0, bufferSize: 2048, format: micFormat) { (buffer, when) in
let sampleData = UnsafeBufferPointer(start: buffer.floatChannelData![0], count: Int(buffer.frameLength))
}
micTapped = true
startEngine()
}
@IBAction func playAudioFile(_ sender: Any) {
stopAudioPlayback()
let playerNode = AVAudioPlayerNode()
let audioUrl = Bundle.main.url(forResource: "test_audio", withExtension: "wav")!
let audioFile = readableAudioFileFrom(url: audioUrl)
audioEngine.attach(playerNode)
audioEngine.connect(playerNode, to: audioEngine.outputNode, format: audioFile.processingFormat)
startEngine()
playerNode.scheduleFile(audioFile, at: nil) {
playerNode .removeTap(onBus: 0)
}
playerNode.installTap(onBus: 0, bufferSize: 4096, format: playerNode.outputFormat(forBus: 0)) { (buffer, when) in
let sampleData = UnsafeBufferPointer(start: buffer.floatChannelData![0], count: Int(buffer.frameLength))
}
playerNode.play()
}
// MARK: Internal Methods
private func configureAudioSession() {
do {
try AVAudioSession.sharedInstance().setCategory(AVAudioSessionCategoryPlayAndRecord, with: [.mixWithOthers, .defaultToSpeaker])
try AVAudioSession.sharedInstance().setActive(true)
} catch { }
}
private func readableAudioFileFrom(url: URL) -> AVAudioFile {
var audioFile: AVAudioFile!
do {
try audioFile = AVAudioFile(forReading: url)
} catch { }
return audioFile
}
private func startEngine() {
guard !audioEngine.isRunning else {
return
}
do {
try audioEngine.start()
} catch { }
}
private func stopAudioPlayback() {
audioEngine.stop()
audioEngine.reset()
}
}
音频样本通过 installTap 的完成处理程序提供给您,该处理程序在音频通过分接节点(麦克风或音频文件播放器)实时通过时被连续调用。您可以通过索引我在每个块中创建的 sampleData 指针来访问单个样本。