热门关键字:  中关村科贸  中关村+科贸  dssad  中关村  商会
行业研究
当前位置 :主页 > 行业研究 > >列表
当前位置 :| 主页 > 行业研究 >

百度语音识别上线新版本 长语音转写告别时间限制

来源:未知 作者:艾希 时间:2017-10-11 15:58 Tag: 点击: 60

   当语音输入不再受时间的限制,用户是否能够真正实现“动口不动手”?近日,百度AI开放平台向开发者免费开放长语音识别功能,通过SDK调用服务,可将长语音转换为文字。据懂得,新版本SDK解除了对时间的限制,开发者无需再将长语音切割成60秒以内的分段,进行调用,晋升了转写的效率和语音识别的体验。对于用户来说,新版本离别之前60秒的“束缚”,可根据需要自行把控时间,极大地进步了灵巧性。

   随着用户对移动端语音功能需求的增长,开发者也开始纷纷将产品接入语音功能。目前,开发者多通过第三方接入语音识别技术,以减少研发时间、下降研发成本。但是,大部分公司供给的语音识别功能有时间限制,相似会议录音、长语句等长语音识别成了困难,固然市面上存在一些长语音识别技术支持方,但开发者需要为此支付大笔的技术接入费用,徒增业务成本。

   对于用户,受“60秒”限制的语音识别功能往往无法知足他们在生活、工作中的需求,这不仅影响他们使用语音识别功能的“兴致”,同时会导致用户对一些搭载了语音识别功能的产品“敬而远之”。

   为解决这些痛点,百度基于原有语音识别技巧,新增长语音识别功能,让语音识别不再局限于60秒,并且为开发者免费开放。好比开发者可将长语音识别用于会议记录、实时字幕和语音笔记等场景,让产品实现不同时长的音频转换为文字信息,或将直播、视频、现场演讲等音频进行实时字幕转换等功能,便利后期文字处置和内容存档,省去记载的人力和时间本钱,大幅提升了转换效率,给予开发者和用户更好的应用体验。

   百度长语音辨认实用于安卓SDK、iOS SDK,均在原有的离在线融会SDK上进级,开发者可依据不同情形接入百度长语音识别功能。目前,开发者可登陆百度AI开放平台(ai.baidu.com),在“SDK下载”界面中,下载休会百度长语音识别功能。

   据了解,作为寰球最早进军人工智能范畴的公司之一,百度早在2010年就已经开端智能语音及相关技术研发,分离于2014年和2015年年底发布了深度语音识别系统Deep Speech和Deep Speech 2。该系统使用“端对端”的深度学习技术,在噪音环境下的表示比谷歌、微软以及苹果的语音系统更好。同时,百度凭借深度语音识别技术于 2016年入选MIT十大打破技术。2017年初,百度推出网页应用SwiftScribe,它能将音频文件转为文本,30秒内就可转换完成时长1分钟的音频文件,转化效率较人工速记快1.67倍,极大提升速记行业转录效率,加速语音行业的发展。

相关新闻
  • 百度地图跑步模式随时随地“变出”健身房2017-09-26 10:16
  • 揭秘更懂你的百度金融磐石反讹诈系统2017-09-13 14:31
  • 营销思路决议出路,怕堵就用百度地图2017-08-30 12:08
  • 百度高精地图:完全自主研发 主动化水平超90%2017-08-29 16:33
  • 识别网络招聘“大忽悠”百度手机卫士提示用户小心陷阱2017-08-25 09:48


上一篇:Cambium Networks为拓展拓展连接宣布推出全新无线宽带解决方案
下一篇:甲骨文高管开怼亚马逊云:它的成本比我们高5