科技网

当前位置: 首页 >IT

多用途唇读新技术可助听讲话内容

IT
来源: 作者: 2019-05-16 21:12:16

ROG玩家国度手机发布这六大卖点让游戏玩
锤子科技推出畅呼吸空气净化器超级除甲醛版
炸大元宵的做法

据英国东英吉利大学消息,该校科学家开发出一种新的唇语阅读技术,不仅有助于解决犯法调查问题,也给那些在听力和讲话方面有困难的人带来帮助。研究人员在近日于上海召开的“国际声学淡季游海南 最强的吃住行省钱完全攻略
、语音和信号处理大会”(ICASSP)上介绍了这1成果。

新的视觉语音辨认技术由东英吉利大学计算科学学院海伦·L.拜尔博士和理查德·哈维教授开发,可以用在“任何凭声音难以确定人们在说什么的地方”。拜尔说,当没法获得声音时,如何确定人们的讲话内容是个独特的问题,比如闭路电视的脚注,或者声音不足又没有对话语境的线索。但现在,通过机器唇读分类技术,能更精确地区分这些声音。

拜尔说,一种稳定的唇读系统能用于从犯法调查到娱乐用处等多种情况。唇读还可以用在运动场上,比如足球运动员在比赛激烈时大喊大叫的单词是什么,但最可能的实际用途还是在那些噪音较大的地方,比如汽车中或飞机驾驶舱内。

研究人员使用了一种新的训练方法,使这种分类系统对以往的唇读方法进行了改进。虽然目前这1系统还有需要改善的地方,但最重要的是,它可以通过调整来用于多种目的,比如给那些有听力障碍或讲话困难的人带来帮助。另外,一个好的唇读机可以作为整体视听识别系统的一部分。

哈维也指出,在人工智能领企业家犯罪报告出炉 金融圈成了重灾区
域,唇读是最具挑战性的难题之一,训练机器如何辨认人类嘴唇的形状和变化并非易事,所以这方面获得的进步非常重要。

相干论文将发表在电气与电子工程师协会(IEEE)《2016年国际声学、语音和信号处理大会会刊》上。

得了厌食症怎么办
诺西分组核心解决方案助运营商极大地降低运营成本
nd/cwty/19014.html" target="_blank">老年人厌食症的症状
功能性消化不良调理

相关推荐