科学家研发人工智能声呐眼镜:可识别唇语,准确率达 95%

4 月 10 日消息,美国康奈尔大学的研究人员开发了一种新技术,可以通过声纳眼镜进行无声沟通。这种眼镜利用微型扬声器和麦克风来读取佩戴者默念的单词,从而可以在不需要物理输入的情况下执行各种任务。

科学家研发人工智能声呐眼镜:可识别唇语,准确率达 95%

这项技术由康奈尔大学的博士生张瑞东(音译)领导开发,是在一个类似的项目的基础上进行的改进,该项目使用了一个无线耳机,而之前的模型则依赖于摄像头。

据IT之家了解,该声纳眼镜使用一种名为 EchoSpeech 的无声语音识别接口,利用声纳来感知嘴部运动,同时使用一个深度学习算法实时分析回波特征。这使得系统能够以约 95% 的准确率识别佩戴者默念的单词。

这项技术最令人兴奋的前景之一是,对于有语言障碍的人来说,可以使用它来无声地将对话输入到语音合成器中,然后将单词大声说出来。眼镜也可以用来在安静的图书馆中控制音乐播放,或者在嘈杂的音乐会上口述信息。

该技术既小巧又低功耗,也不会侵犯隐私,因为没有数据离开用户的手机。这样,就不会有隐私方面的担忧。眼镜佩戴非常方便,比其他可用的无声语音识别技术更实用、更可行。

研究人员表示,该系统只需要几分钟的训练数据来学习用户的语音模式,学习完成后,就可以朝用户的脸上发送和接收声波,感知嘴部运动,同时使用深度学习算法分析回波特征。该系统目前能够识别 31 个孤立的命令和一串连续的数字,并且错误率低于 10%。

该系统目前的版本提供了大约 10 小时的电池续航,并且可以通过蓝牙无线地与用户的智能手机通信。智能手机负责处理和预测所有数据,并将结果传输到一些“动作键”,让它可以播放音乐、与智能设备交互或激活语音助手。

康奈尔大学智能计算机接口未来交互(SciFi)实验室正在利用康奈尔大学的一个资助计划来探索将这项技术商业化的可能性。

文章版权声明

 1 原创文章作者:luiliutaozuan,如若转载,请注明出处: https://www.52hwl.com/65558.html

 2 温馨提示:软件侵权请联系469472785#qq.com(三天内删除相关链接)资源失效请留言反馈

 3 下载提示:如遇蓝奏云无法访问,请修改lanzous(把s修改成x)

 免责声明:本站为个人博客,所有软件信息均来自网络 修改版软件,加群广告提示为修改者自留,非本站信息,注意鉴别

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2023年7月17日 下午12:19
下一篇 2023年7月17日 下午12:20