我知道Google语音搜索的工作原理是将原始音频(当然是数字化的)发送到Google的服务器,然后Google以文本形式返回结果。
结果本身相对较小(除非它是一个很长的句子...),所以我相信通过互联网发送它所花费的时间可以忽略不计(折扣HTTP开销,服务器负载等)
我有兴趣知道的是实际"模拟"的大小(KB)。原始音频发送到谷歌的语音服务器,以获得该组件对互联网连接速度(上行链路)的依赖性。
当然,原始音频包的大小非常依赖于所说的短语(一个单词?整个句子?一个很长的句子?),所以我正在寻找一些关于这个的统计信息(平均,典型等) )。
我也知道那些原始音频数据包是压缩的。有关压缩方法的任何信息? (它不是MP3,不是吗?)
Android设备和PC(即基于Chrome)之间的压缩是否不同?
虽然这似乎不是一个直接的编程问题,但就我而言,它与编程非常直接相关,因为答案可能会影响在构建基于Google语音搜索的应用程序时使用的算法。
答案 0 :(得分:2)
我还没有测量实际发送到Google服务器的数据量,但我们可以合理地假设语音搜索
在这种情况下,1秒的录音消耗(1 * 16,000 * 2) / 2 = 16,000 bytes
。