RecognitionListener中onRmsChanged的最大值是多少

时间:2014-01-18 19:23:33

标签: android text-to-speech

我正在android中实现语音到文本。我想以与谷歌语音到文本相同的方式向用户提供反馈。某种类型的指示为声级下降和峰值

我有onRmsChanged的值。为了将此映射到最大值为100的进度条,我需要知道onRmsChanged的最大值。

但它没有在任何地方说明?

如何在不知道最大值的情况下显示声级反馈?

class listener implements RecognitionListener {
        public void onReadyForSpeech(Bundle params) {
            Log.d(TAG, "onReadyForSpeech");
        }

        public void onBeginningOfSpeech() {
            Log.d(TAG, "onBeginningOfSpeech");
        }

        public void onRmsChanged(float rmsdB) {
                        Log.d(TAG, "onRmsChanged " + rmsdB);
        }

        public void onBufferReceived(byte[] buffer) {
            Log.d(TAG, "onBufferReceived");
        }

        public void onEndOfSpeech() {
            Log.d(TAG, "onEndofSpeech");
        }

        public void onError(int error) {
            Log.d(TAG, "error " + error);

        }

        public void onResults(Bundle results) {
            Log.d(TAG, "onResults " + results);

        }

        // Called when partial recognition results are available.
        public void onPartialResults(Bundle partialResults) {
            Log.d(TAG, "onPartialResults");
        }

        public void onEvent(int eventType, Bundle params) {
            Log.d(TAG, "onEvent " + eventType);
        }
    }

1 个答案:

答案 0 :(得分:1)

你可能会稍微复杂一点。

该值为浮点数,因此理论上最大可能值为Float.MAX_VALUE

浮点数的值由the new RMS dB value生成。

有关RMS

的信息

有关dB

的信息

我觉得你所关心的只是向用户解释音量?因此,只需选择安静,中等和响亮的音阶,并相应地调整UI。

    @Override
    public void onRmsChanged(final float rmsdB) {

        float quiet_max = 25f;
        float medium_max = 65f;

        if (rmsdB < quiet_max) {
            System.out.print("Quiet" + rmsdB);
            // quiet
        } else if (rmsdB >= quiet_max && rmsdB < medium_max) {
            System.out.print("Medium" + rmsdB);
            // medium
        } else {
            System.out.print("Loud" + rmsdB);
            // loud
        }
    }

通过在测试期间调整语音级别,您应该能够确定安静,中等和响亮的阈值。不要忘记在多个设备上进行测试,因为这可能因设备硬件而异。虽然它的变化不应该太大,以至于搞乱你想要提供的视觉反馈。

希望有所帮助。