虽然苹果和谷歌的语音识别技术看起来很强大,不过使用硬件去进行相应的信息处理仍显得吃力。
以Siri为例,它很依赖于芯片上的数字信号处理器(DSP,digital signals processor)来增强CPU处理这方面数据的能力,让其移除背景噪音,准备好上传到云端进行处理的语音文件。用户的话语需要说得比较规范,比如声音要更洪亮,说得更专注,而这样说话也显得不自然。
无论苹果和谷歌的技术,都需要按下手机上的按键,然后才能说出话语让其接收语音信息(原文似乎忽略了Moto X的存在)。
英特尔计划在Bay Trail上通过SST DSP来解决这样的问题,并且会把这功能集成到2014年的Broadwell上。这技术将会带来一个更自然的语音识别系统,而不会让CPU有那么重的工作负担。
据称Windows 8提供把声音处理的工作交给DSP的软件支持,就VR-Zone所掌握的的资料而言,英特尔的技术有可能会和微软的这些软件技术结合起来共同运作。
把声音处理的工作交给DSP,可以让设备上代号Genie的个人助手应用在电池节能模式下一直侦听用户的指令,就是说不用再按下什么特定的键才能说话,对着手机直接说话就可以让手机接收语音指令了。英特尔表示通过2014年的Broadwell解决方案,用户在说出“Hello Computer”的话语后会得到确认,而到了2015年识别技术的精准度会有所提高。
英特尔还表示系统会识别特定用户的声音,就是说房间里另一个人说的话并不会触发助手软件。
图片展示了Genie、必需的API、英特尔SST驱动、DSP之间的运作
英特尔还在和DTS及Waves进行研发,计划提供对输出声音编码的支持。这比起语音识别要简单一些,对于CPU的占用也不会那么多。
超能网友博士 2013-10-15 14:16 | 加入黑名单
该评论年代久远,荒废失修,暂不可见。
支持(0) | 反对(0) | 举报 | 回复
3#
我匿名了 2013-10-15 11:51
该评论年代久远,荒废失修,暂不可见。
支持(0) | 反对(0) | 举报 | 回复
2#
游客 2013-10-15 10:33
该评论年代久远,荒废失修,暂不可见。
支持(1) | 反对(0) | 举报 | 回复
1#