产品展示

Products Classification

语音识别结合应用场景:未来可期

  • 产品时间:2022-01-15 00:32
  • 价       格:

简要描述:将近二十年来,语音辨识技术获得明显变革,开始从实验室走向市场。人们预计,未来10年内,语音辨识技术走出了工业、家电、通信、汽车电子、消费电子产品等各个领域。 语音辨识作为人工智能发展最先、且首度商业化的技术,近几年来随着深度自学技术的突破,辨识准确率大幅度提高,造就了一波产业热潮。对语音辨识未来发展,各位大咖也有一些精彩论点。...

详细介绍
本文摘要:将近二十年来,语音辨识技术获得明显变革,开始从实验室走向市场。人们预计,未来10年内,语音辨识技术走出了工业、家电、通信、汽车电子、消费电子产品等各个领域。 语音辨识作为人工智能发展最先、且首度商业化的技术,近几年来随着深度自学技术的突破,辨识准确率大幅度提高,造就了一波产业热潮。对语音辨识未来发展,各位大咖也有一些精彩论点。

Betway88必威

将近二十年来,语音辨识技术获得明显变革,开始从实验室走向市场。人们预计,未来10年内,语音辨识技术走出了工业、家电、通信、汽车电子、消费电子产品等各个领域。

语音辨识作为人工智能发展最先、且首度商业化的技术,近几年来随着深度自学技术的突破,辨识准确率大幅度提高,造就了一波产业热潮。对语音辨识未来发展,各位大咖也有一些精彩论点。  科大讯飞研究院副院长——王士进  王士进回应,语音辨识是嵌入式里很最重要的模块,从PC时代到现在的移动互联时代,嵌入式由鼠标键盘南北智能手机、Pad等的多点触碰。

到了智能硬件时代,交互则更为多元,不仅有触碰,还有基于语音、视觉的交互。原本是以机器为中心的嵌入式,渐渐南北以人为中心的大自然交互。  他指出,在将来万物网络的浪潮下,以语音居多,键盘、触碰、视觉、手势辅的交互时代迅速不会来临。

  提及传统的语音交互,王士进列出了几个缺点:第一,交互距离要将近;第二,发音必需标准;第三,环境必需安静;第四,人机无法持续对话。  科大讯飞在2015年明确提出AIUI,目的解决问题上述问题同时希望在人工智能时代获取一种智能的嵌入式界面。

AIUI获取远场苏醒和辨识减震方案,相容全国近17种方言,可以展开全双工交互和基于业务场景的多轮对话,同时融合讯飞来超脑的理解智能使得机器展开更加智能的交互。  AIUI构建了韧一体化、云端一体化、技术服务一体化,通过三个一体化获取人机智能交互整体解决方案,使得用户可以较慢转换到新的业务场景。  在提及基于AIUI交互技术的一些商业化尝试时,王士进列出了几种:  在交流方面,科大讯飞在05年发售了听到智能会议这款产品。

一般来说,会议场景的同传准确率为80%左右,而智能会议拉丁化准确率则能超过90%以上,之后,其在医疗和司法系统展开了应用于。另外,科大讯飞还发售了便携翻译机,更容易随身携带,便利远程动态交流。  在电视方面,最先的电视是用数字特上下左右按键掌控仅有的十几个台,而现在的智能电视后台接入海量资源,通过讯飞来智能电视助手可以展开便利的语音交互,节省时间。

  在汽车方面,由于人在驾驶员时候手无法离开了方向盘,故把语音引进替换手展开交互不会便利许多。实质上比起其他应用于场景,语音辨识由于汽车场景的噪音更加强劲,面对更大挑战,而科大讯飞也在基于车载的语音辨识做到了许多优化,更加在宝马、飞驰、标准化举办的全球车载语音辨识比赛获得第一名,有效地的承托了车载场景的交互。  在机器人方面,机器人与人的语音交互符合大自然交互、个性化服务以及基于业务场景的统合服务,可以便利的给定停下来,在解读用户的市场需求下展开精准的内容引荐和服务。

  语音辨识和自然语言解读都是基于统计资料和概率体系,所以商业化过程建议自由选择人受到一定容许(如车载)或者很难做到百分之百准确(如会议同传)的场景,然后随着技术的更进一步成熟期,可以转入到更加多的场景。  最后,王士进总结道,“语音辨识和嵌入式技术在展开技术优化的同时更加要融合应用于场景,最后可使得技术完备,产业更佳的发展。”  百度语音技术部声学技术负责人——李先刚  提及这些年对手机百度语音搜寻的大大优化过程,李先刚指出要作好这样一个产品,再行要搜集涉及数据,然后将语音辨识应用于推展到涉及产品线再上用户用于,用户用于后对系统回去数据构成原始链条,最后超过十分极致的状态。

betway东盟体育

  他把输入法在语音辨识中的起到阐释为:输入法这一场景对语音辨识性能提高有十分大的协助。  而今年,百度在语音技术方面的进展还包括基于GramCTC的端对端语音识别系统以及端对端说出人辨识技术。  基于CTC的端对端语音识别系统是目前主流的工业系统,在2015年底,百度构建了CTC端对端语音识别系统的上线。而今年,百度更进一步明确提出了GramCTC算法。

  主流的说出人辨识技术用于经典的DNN-IVECTOR技术,其框架基于统计资料模型,并将DNN引进此框架去自学。  可以看见的是,语音辨识已南北大数据和端对端的道路,百度也将把说出人辨识技术向此发展,更进一步提高涉及性能。


本文关键词:语音,识别,结合,应用,场景,未来,可期,将近,Betway88必威

本文来源:betway东盟体育-www.goodxiyi.com

 


产品咨询

留言框

  • 产品:

  • 留言内容:

  • 您的单位:

  • 您的姓名:

  • 联系电话:

  • 常用邮箱:

  • 详细地址:


推荐产品

Copyright © 2004-2021 www.goodxiyi.com. betway东盟体育科技 版权所有 备案号:ICP备51909065号-7

在线客服 联系方式 二维码

服务热线

0931-780324558

扫一扫,关注我们