我的意思是;
我在Android上使用语音识别课程,我接受了语音识别。
但我想要真正的语音数据而不是语言。
例如,我说'teacher'
和android让你说老师。好吧它好,但我想要我的声音,包括'teacher'
。它在哪里?我可以把它拿到另一个地方吗?
我使用这个课堂来讲话:
package net.viralpatel.android.speechtotextdemo;
import java.util.ArrayList;
import android.app.Activity;
import android.content.ActivityNotFoundException;
import android.content.Intent;
import android.os.Bundle;
import android.speech.RecognizerIntent;
import android.view.Menu;
import android.view.View;
import android.widget.ImageButton;
import android.widget.TextView;
import android.widget.Toast;
public class MainActivity extends Activity {
protected static final int RESULT_SPEECH = 1;
private ImageButton btnSpeak;
private TextView txtText;
@Override
public void onCreate(Bundle savedInstanceState) {
super.onCreate(savedInstanceState);
setContentView(R.layout.activity_main);
txtText = (TextView) findViewById(R.id.txtText);
btnSpeak = (ImageButton) findViewById(R.id.btnSpeak);
btnSpeak.setOnClickListener(new View.OnClickListener() {
@Override
public void onClick(View v) {
Intent intent = new Intent(
RecognizerIntent.ACTION_RECOGNIZE_SPEECH);
intent.putExtra(RecognizerIntent.EXTRA_LANGUAGE_MODEL, "en-US");
try {
startActivityForResult(intent, RESULT_SPEECH);
txtText.setText("");
} catch (ActivityNotFoundException a) {
Toast t = Toast.makeText(getApplicationContext(),
"Ops! Your device doesn't support Speech to Text",
Toast.LENGTH_SHORT);
t.show();
}
}
});
}
@Override
public boolean onCreateOptionsMenu(Menu menu) {
getMenuInflater().inflate(R.menu.activity_main, menu);
return true;
}
@Override
protected void onActivityResult(int requestCode, int resultCode, Intent data) {
super.onActivityResult(requestCode, resultCode, data);
switch (requestCode) {
case RESULT_SPEECH: {
if (resultCode == RESULT_OK && null != data) {
ArrayList<String> text = data
.getStringArrayListExtra(RecognizerIntent.EXTRA_RESULTS);
txtText.setText(text.get(0));
}
break;
}
}
}
}
感谢。
答案 0 :(得分:2)
因此,您希望使用Android speech recognition API来获取用户所说内容的转录和音频。我所知道的唯一解决方案是使用SpeechRecognizer
- 类。这允许您与系统上安装的语音识别器进行交互,但您必须自己实现UI(麦克风按钮,错误消息显示等)。所以这比使用普通RecognizerIntent.ACTION_RECOGNIZE_SPEECH
多一点工作。您的案例中的相关类/方法是:
请注意,最后一种方法的文档包括无法保证此方法将被调用,因此语音识别API并非真正设计为允许音频捕获。它还说采样率取决于实现。,即你甚至不知道如何播放音频(或将其保存到wav)。
另见答案https://stackoverflow.com/a/10918416/12547
总结: