我想知道我是否可以将谷歌的语音识别api用于我的桌面应用程序。我已经看到一些例子,我必须将语音转换为文件并发送到网址。但这将是一项繁琐的任务,因为在我的应用程序中,用户必须不断提交他的声音。那么还有其他替代方法可以使用google speech api。我最不感兴趣的是与sphinx一起使用,因为它的准确性非常低,我不知道如何在字典中添加新单词而不将其添加到字典中它不会识别新单词。任何帮助将不胜感激。
答案 0 :(得分:1)
你指的是环境监听吗?我实际上正在使用Google语音识别API处理一些语音活动检测算法。虽然我还没有完成算法,但我添加了一个音量和频率计算器,这样当你不说话时你就不必向Google发送请求。这是源代码的链接。
https://github.com/The-Shadow/java-speech-api
(这不是我使用的,但它很简单。你也可以添加频率阈值保持和东西。我把这些代码放在一起所以不能保证它会工作看看API的示例分支。)
//package recognitionprocess;
//import org.jaudiotagger.audio.*;
import java.io.FileOutputStream;
import java.io.IOException;
import java.io.RandomAccessFile;
import javax.sound.sampled.AudioFileFormat;
import com.darkprograms.speech.recognizer.GoogleResponse;
import com.darkprograms.speech.recognizer.Recognizer;
public class RecognitionMain {
public static void main(String[] args) {
try{
ambientListening();
}
catch(Exception e){
e.printStackTrace();
}
}
private static void ambientListening() throws Exception{
String filename = "tarunaudio.wav";//Your Desired FileName
MicrophoneAnalyzer mic = new MicrophoneAnalyzer(AudioFileFormat.Type.WAVE);
mic.open();
mic.captureAudioToFile(filename);
final int THRESHOLD = 10;//YOUR THRESHOLD VALUE.
int ambientVolume = mic.getAudioVolume();//
int speakingVolume = -2;
boolean speaking = false;
for(int i = 0; i<1||speaking; i++){
int volume = mic.getAudioVolume();
System.out.println(volume);
if(volume>ambientVolume+THRESHOLD){
speakingVolume = volume;
speaking = true;
Thread.sleep(1000);
System.out.println("SPEAKING");
}
if(speaking && volume+THRESHOLD<speakingVolume){
break;
}
Thread.sleep(200);//Your refreshRate
}
mic.close();
//You can also measure the volume across the entire file if you want
//to be resource intensive.
if(!speaking){
ambientListening();
}
Recognizer rec = new Recognizer(Recognizer.Languages.ENGLISH_US);
GoogleResponse out = rec.getRecognizedDataForWave(filename);
System.out.println(out.getResponse());
ambientListening();
}
}