<<返回上一页

读我的唇语

发布时间:2017-10-08 04:03:48来源:未知点击:

Duncan Graham-Rowe就像我们一样,计算机很难听到在嘈杂的房间里说什么所以匹兹堡卡内基梅隆大学的计算机科学家正在教他们读唇读 CMU的计算机科学家Alex Waibel表示,无论你是否意识到这一点,你都会非常擅长阅读 “当人们处于嘈杂的环境中时,他们会更加关注嘴唇,”他说唇读可以大大提高我们对人们所说内容的理解 Waibel的新软件名为NLips,旨在降低嘈杂环境中语音识别软件的错误率 Waibel表示,对于那些在周围环境安静时成功获得92%成功的软件,唇读只会略微有所帮助,将成功识别率提高到93%左右但是当存在大量背景噪音时,典型封装的成功率降至约60% - 而NLips可以将其提升至约85%与大多数语音识别系统一样,NLips将语音分解为离散的声音块,称为音素,但最重要的是它还结合了唇部运动的信息计算机安装的摄像机使用跟踪软件记录嘴唇序列,以补偿头部的任何轻微移动一个神经网络,随着它一起学习,不断监视视频序列中的嘴唇,寻找50个视觉等效的音素,或者像Waibel所称的“视位”软件交叉检查语音识别程序的输出与视位 Waibel表示,NLips的工作原理非常好,因为它结合了不同的视觉和音频感知信息他承认唇读软件本身毫无希望 Waibel说他的实验室“正在研究所有这些信号并完整地捕捉感知世界”,就像人类一样到目前为止,Waibel和他的同事们只是逐字测试了用于拼写单词的NLips但他有信心转发连续语音应该是直截了当的,因为大多数语音识别软件发现这不是拼写的挑战有这么多字母听起来很相似,歧义导致很多拼写问题 Waibel现在正在努力将NLips整合到一个视频会议系统中,该系统可以自动创建所述内容和由谁发送的成绩单弗吉尼亚州阿灵顿国家科学基金会的几个语音识别项目的项目经理Gary Strong认为,语音识别软件公司遵循CMU的双管齐下方法只是时间问题他说,下一个目标是将声音识别放入嘈杂的车辆中 - 例如,允许您向汽车发出声控命令 - 但这在过去一直受到背景车辆噪音无法预测的影响除非可以降低错误率,