bbs.geermuzixun.com

注册

 

发新话题 回复该主题

科大讯飞我们和华为基因相似,板凳能坐十年 [复制链接]

1#
北京去哪里医院治疗白癜风 https://wapjbk.39.net/yiyuanzaixian/bjzkbdfyy/

向C端强劲发力,瞄准用户规模更大的消费者市场,AI应用红利得以兑现。

这是“AI国家队”科大讯飞正在探索的新路。与互联网不同,在人工智能领域中,ToC业务反而未经大范围开拓。

不变的是,先布局的玩家,先占据优势。

5月21日,在上海世博举办的年度发布会上,科大讯飞大秀技术肌肉,针对用户痛点发布6款新品,其中5款为面向消费者的硬件产品。

其中包括能实现0.5秒闪译、支持四大方言与英文互译的讯飞翻译机3.0,售价元;以及一小时录音5分钟出稿的讯飞录音笔,分为元和元两个版本。

今年是科大讯飞成立20周年,恰逢国际贸易摩擦升级的历史关卡,讯飞表示要在技术上未雨绸缪,做好十年磨一剑的准备。

科大讯飞董事长刘庆峰:20年不断累积,AI技术价值今年将开始兑现

与往年发布会流程相似,发布新品前,科大讯飞董事长刘庆峰进行开场演讲。

与往年发布会有所不同,这是全球首场人工智能多语种直播发布会。

开场的“AI虚拟主播”主持人便吸引了不少人的眼球。不仅如此,这位虚拟主播还同时支持多语言同步报道。

AI虚拟主播进行韩语报道

虚拟主播藏语报道

技术肌肉秀不止于此,随后科大讯飞董事长刘庆峰亲自表演了一场类似“柯南领夹”的AI变声秀。

刘庆峰登场进行自我介绍,一开口,现场却传出来的是“老罗”罗永浩的声音,“大家好,我是科大讯飞刘庆峰”,刘罗难辨。

不一会儿,他的声音又开始变成清脆的女声,虽然是志玲姐姐的声音,但说活语气、节奏却和刘庆峰本人完全一致。

这背后正是运用科大讯飞的音色转换技术,可通过提取原声语音中的内容信息,包括原声的节奏和情感,再结合特定人的音色进行转换结合。

该项技术在voiceconversionChallenge国际音色转换大赛中获得全部指标第一名,也是音色和相似度上唯一一家超过4.0MOS分的系统。

另外,在嘉宾的同时,舞台旁边都有“讯飞听见”直接进行现场实时语音识别并准确呈现出来,同时机器自动将讲话内容翻译成英文。

嘉宾演讲过程中,讯飞听见一直进行实时语音识别和英文翻译

这其中的技术又有了革新——科大讯飞采用自主研发的新一代语音识别模型,实现了中英文语音混合输入,识别无缝切换,且识别率达到95%以上。

关于所谓的中英文语音混合输入,举个例子:

“看最后一集GameofThrones了吗,囧雪竟然做出了这样的事儿,很bad很sad很drama。”

有了这项技术,不管“讯飞听见”有没有被剧透,它都能准确识别并且翻译你说的话。

除此之外,刘庆峰还介绍了科大讯飞在国际上取得的技术突破:

语音识别:语音识别准确率全面超过速记员。目前,科大讯飞的中文语音转写准确率已经突破98%,英文达到95%。机器翻译:系统通过CATTI全国翻译专业资格(水平)测试,达到专业资格合格标准;让更多“语言间的高效沟通”成为可能,让机器翻译能力确有保障。机器阅读理解:年3月,机器阅读理解国际权威评测SQuAD2.0任务科大讯飞再次登顶冠*,并同时在EM和F1两个指标上全球首次均超越人类水平,一举创下比赛的全新纪录。

年伊始,不少人认为这将是大量人工智能创业倒闭的时候,大潮退去,泡沫破灭,因为人工智能并没有核心技术。

对于这样的论调,刘庆峰在现场明确表示:“年就是人工智能的应用价值兑现年,今年开始真的红利已经到来。”他提出了A.I.技术价值兑现的三大标准:

一、真实可见的实际应用案例

二、能规模化应用的核心产品

三、能够统计数据的应用成效

技术肌肉已秀,接下来让我们看看实际落地、将要帮助讯飞获得红利的硬件新品:

新品强劲发力C端:讯飞翻译机3.0实现“0.5闪译”,售价元

讯飞此次一口气发布5款消费者硬件产品,覆盖生活、工作、学习等方面,每一款都针对消费者痛点。

先来看下讯飞翻译机3.0。

说话是世界上最常见的事情,又是世界上最不简单的事情,不同国家之间语音不同,不同的省份地区也有着各自的方言。

然而一个人精通多种语音需要花费大量的时间和精力,就像刘庆峰在现场所说的那样“不可能每个人都是钱钟书转世”,但AI让不可能变成可能。

讯飞翻译机3.0全新升级,翻译速度达到“0.5秒闪译”,实现清楚拾音、响亮外放和智能识别多音多义词。

讯飞翻译机3.0

对消费者更实用的是支持多种语言互译,讯飞翻译机3.0支持普通话与粤语、东北话、河南话、四川话等翻译,及粤语和英语互译、维吾尔语与普通话互译、藏语与普通话互译。

其中的英语,不仅限于标准的英文发音,在现场演示中,讯飞翻译机3.0能将带有咖喱味的、法国奶酪味的、德国啤酒味的、俄罗斯伏特加味的英文统统翻译成标准的普通话。

另外,继去年首发行业A.I.翻译功能后,讯飞翻译机3.0实现金融、医疗、外贸、计算机、法律、体育、能源七大领域的A.I.行业翻译。

除此之外,翻译机3.0还优化了拍照翻译功能,升级高清摄像头和视网膜屏,出国旅游看不懂菜单的尴尬将不再出现。

拍照翻译采用科大讯飞最新国际领先的OCR技术,该技术去年包揽ICPR国际大赛全部三项冠*。刘庆峰表示,科大讯飞为何开始做图像识别?因为语音识别和图像识别的底层算法是相通的。

相比于讯飞翻译机2.0(售价元),翻译机3.0售价为元。

接下来是另一重磅产品:讯飞智能录音笔,这也是讯飞5款硬件新品中,价格最低的一款,分为元标准配置和元两款,来看下性能:

采用2+6麦克风阵列顶级配置,2颗哈曼大直径麦克风和6个矩阵麦克风位列机身;收音距离可达15米;语音识别准确率达到98%,1小时录音5分钟出稿;支持语音实时转文字、中英边录边译、要点标记、语音搜索、多平台同步和后端编辑功能。除此之外,还有针对办公所出的讯飞转写机、讯飞办公本,以及针对教育所处的讯飞学习机,这三款价格均高于元:

新品展示:左上为讯飞智能办公本、左下为讯飞转写机、右上为讯飞录音笔,右下为讯飞学习机

商务人士的专属:讯飞转写机是一体化的专业语音转文字设备,面向会议、培训、讲座等场景下可实现实时转写、纯离线识别、识别内容翻译成英文投屏展示,同时可为视频会议实时生成配套字幕输出,会议、演讲结束后可自动生成

分享 转发
TOP
发新话题 回复该主题