速录速记网 http://www.sulufans.com
投稿邮箱:sujipx@163.com
当前位置:>> 首页 >> 信息处理 > ACR语音识别 > 机器人开始抢速记员的饭碗:语音和语言将成为认知智能

机器人开始抢速记员的饭碗:语音和语言将成为认知智能

发布时间:2024/5/2 11:52:39 阅读次数:4941

语音为主触摸图像手势为辅的万物智能时代到来

刘庆峰在发布会现场定义了认知智能的三大核心支撑能力:人机交互、知识管理与推理学习。随后科大讯飞发布了讯飞超脑2.0科研项目,希望不仅赋予机器“能听会说”的能力,还能赋予机器“能理解会思考”的能力,使机器可以在不久的将来在高考中折桂。

在讯飞超脑的产业化应用产品层面,科大讯飞发布了人机交互新产品——AIUI。AIUI集成了包括双全工技术、麦克风阵列技术、声纹识别技术、方言识别、语义理解技术和和内容服务等等。在发布现场将演讲同步转写成文字的“速记机器人”技术,正是基于这一AIUI界面支持。

科大讯飞还在大会上发布了几款语音转换To C产品——录音宝、录音笔与讯飞听见网。据刘庆峰介绍,实际上,音文转写是当下都市生活的一种经常性需求,在正式发布之前,录音宝产品已经有了超过100万的用户。而随着流媒体的不断演进与普及,相信在未来的图文直播时代,科大讯飞的音文转录产品的价值将会更加凸显。

人工智能=深度神经网络+大数据+涟漪效应

科大讯飞研究院院长胡郁在刘庆峰之后介绍了科大讯飞的讯飞超脑是怎样炼成的。胡郁将最近一次人工智能发展高潮的出现归结于3大因素:深度神经网络、大数据和涟漪效应。

通过深度神经网络把大数据的威力充分地发挥出来,把每个用户他们的经验和知识他们的数据加入到核心技术研发过程中来,这就是科大讯飞所说的涟漪效应。

胡郁形象地在现场解释了涟漪效应到底是什么:“想象一个水滴滴到水面的时候,那么这个水面就是我们所有的用户人群,而水滴所激发起来的涟漪就是水波纹,其实是这个核心技术它一开始的效果。在实验室里面90%的正确率的识别系统放到真实环境下正确率只有55%。但是没有关系,只要这个系统上线了运行了,我们就不断地有用户,他们就会不断地贡献数据,我们的系统就改进了。当这个水波纹扩散出去、有更多人用的时候,系统已经是改进过以后的系统。”

“万物互联时代”已经到来,语音为主,触摸、图像、手势为辅,将成为人机交互的新常态,而在这种人类生活的新常态中,人工智能技术的突破是用来延伸人类能力而非替代人类的。人工智能将使人类更幸福、更富想象力和创造力。


上一页[1] [2]

 
返回速录fans首页

上一篇:人工智能PK金牌速记员之实战录
下一篇:什么是ACR语音识别
相关标签:,速录师培训,中国速录速记权威网站
相关文章

图文报道