期刊信息

主管单位:天津市文学艺术界联合会
主办单位:天津市文学艺术界联合会
编辑出版:《艺术家》杂志社
国际刊号:ISSN1004-1206
国内刊号:CN12-1035/J
创刊时间:1988年
开本尺寸:大16开
语言种类:中 文
出版周期:月 刊
每册定价:30.00元
网  址:ysjzzs.cn
投稿邮箱:ysjtgyx@163.com

本刊声明

       凡投稿本刊的稿件,作者文责自负,确保稿件不涉及保密事项,署名无争议。对于以任何形式侵犯他人著作权的行为,作者应独立承担法律责任,本刊概不承担任何连带责任。来稿凡使用,即视为全体著作权人同意将所投稿 件的复制权、发行权、汇编权、翻译权、信息网络传播权转让给本刊杂志社。本社可以将上述权利转授给第三方使用,特此声明!

编辑部公告

通知:敬请各位作者注意,本刊诚征优秀学术稿件,来稿必须为原创稿,不得抄袭和篡改他人作品。凡是投稿本站正在审核期的文章,请勿一稿多投。审稿期限一般二到三个工作日,作者可以随时在本站作者查稿系统中输入文章编号,查询稿件审核情况。

人工智能声呐眼镜可识别唇语

来源:本刊杂志社        点击:        发布时间:2023年04月10日

人工智能声呐眼镜可识别唇语

  准确率约为百分之九十五

  【总编辑圈点】

  科技日报北京4月9日电 (记者张佳欣)美国康奈尔大学研究人员开发了一款声呐眼镜,它通过声学感应和人工智能跟踪嘴唇和嘴巴的动作,可连续识别多达31条无声的命令,该系统可为那些暂时不方便说话或无法发声的人提供帮助。相关论文将在本月于德国汉堡举行的计算机协会计算系统人为因素会议上发表。



  这款眼镜是一种名为EchoSpeech的无声语音识别接口。该眼镜配备了一对麦克风和比铅笔橡皮擦还小的扬声器,成为一个可穿戴的人工智能驱动的声呐系统,在面部发送和接收声波,并感知嘴巴的运动。然后,深度学习算法实时分析这些回声轮廓,准确率约为95%。这款低功耗、可穿戴的眼镜只需要几分钟的用户训练数据,即可识别命令并可在智能手机上运行。

  EchoSpeech可用于在说话不方便或不合适的地方通过智能手机与他人交流,比如在嘈杂的餐厅或安静的图书馆里。无声语音界面还可与触笔配对,并与CAD等设计软件一起使用,几乎不需要键盘和鼠标。

  研究人员表示,他们正在将声呐技术“搬”到人体上。它体积小、功耗低、对隐私敏感,这些都是在现实世界中部署新的可穿戴技术的重要功能。无声语音识别中的大多数技术都局限于一组选定的预定命令,需要用户面部或佩戴摄像头,这既不实用也不可行。可穿戴式摄像头也存在重大的隐私问题,对用户和与之互动的人来说都是如此。而像EchoSpeech这样的声学传感技术消除了对可穿戴式摄像机的需求。

  此外,由于音频数据比图像或视频数据小得多,因此EchoSpeech只需更小的带宽,通过蓝牙实时传输到智能手机上,且数据在本地,不在云端,确保了敏感隐私信息安全。


地址:中国 天津市和平区新华路237号(300040)
您是本站第 位访问者