我正在使用https://github.com/TalAter/annyang将语音翻译成文字。
在调用annyang.start();
后,我发现麦克风连接到谷歌的语音识别引擎,并且只会在调用annyang.abort()
后停止传输数据。
必须知道我是否可以将麦克风打开以进行被动语音检测,或者是否需要在发出命令后关闭麦克风以保留数据和带宽。
我无法找到有关Google语音识别使用的数据量的任何统计信息。
我是否遗漏了有关此主题的任何文档,或者我如何自己衡量?
答案 0 :(得分:2)
不确定这是否是标准的,但这是我的发现:
我看了一下网络活动。
启动语音识别服务后,我的输出带宽从每秒几个字节(0~60 bps)变为每秒约18KB~20KB,每秒传输约+ 1KB~1.5 KB。
无论我发出什么样的声音,这个速度似乎都很稳定。
+ - 每秒20KB乘以60 * 60 = 72000KB。
<强>结论:强>
如果服务处于活动状态,语音识别将以每小时约72梅的速度消耗。