机器之心原创
作者:张倩
CVPR上诞生的技术正在逐渐「出圈」。
啤酒、烧烤、欧洲杯是很多球迷今年夏天的消暑利器。但你可能想不到的是,那些精彩的进球集锦、球星慢动作回放说不定是AI做的。
在今年的CVPR大会上,百度向我们确认了这一点。
他们的AI可以在无人工介入的条件下,精准、实时地切分出进球、射门、犯规等动作片段。基于此项能力,团队开发出了一系列应用工具并成功落地,包括:
1.自定义足球精彩集锦生成工具。只需输入球员并选定比赛场次,AI就能自动生成这个球员的精彩瞬间视频集锦以及慢动作回放。相关产品已经在百度百科多个足球球员和球队页面落地。
2.足球图文战报一键转换视频平台。只需要输入文字直播内容或者直播间地址,AI就能智能聚合生成对应的视频内容。
3.基于图像场景识别的智能视频生产线。该生产线可以快速理解上传的长视频,检测是否有进球、精准定位视频中的进球瞬间,并完成自动剪辑。
最近,这些技术还帮他们拿到了一个重量级赛事的双料冠军。
在刚刚闭幕的CVPR大会上,百度取得了SoccerNet-v2足球视频理解竞赛的全部两项任务的冠军,这是全球首个以足球比赛视频的全方位理解为目标的竞赛。
而且,这还只是百度今年CVPR成绩单的一部分。
作为「中国军团」多年出征AI顶会的一员「老兵」,百度在今年的CVPR上再次创下新纪录:不仅入选了22篇优质论文,还连获10个挑战赛冠军,在去年8个冠军基础上实现新突破。
此外,百度还主办了一场重量级学术Workshop和一场Tutorial,并受邀在大会上做同声传译特邀报告和PaddleCV技术分享演讲。
这种全方位的发声方式不仅让我们看到了百度在CV领域的研究、落地成果,还展示了该公司在NLP、AutoDL等领域的前沿探索以及多个领域的融合创新。
在这篇文章中,我们就来盘点一下这些内容。
十项CV冠军,聚焦自动驾驶、智能交通、智慧城市、智能创作等多个赛道
CVPR覆盖了计算机视觉多个细分领域,百度此次参与并获得了七项挑战赛的十个冠军。其中,六项冠军成果可加速自动驾驶、智能交通、智慧城市等落地和应用,部分成果可助力智能创作工具的打造。
六项冠军助力自动驾驶、智能交通、智慧城市应用落地
对于百度来说,自动驾驶可以说是CVPR舞台上的一项「传统艺能」了。早在年,百度Apollo就占据了CVPR自动驾驶的主场;年,Apollo又在CVPR上公开了国内唯一的自动驾驶纯视觉城市道路闭环解决方案——ApolloLite。这些高光时刻在今年的多项竞赛中得到了延续。
在今年取得的十项冠军中,「语义分割、高分辨率人体解析、雾天环境检测」赛道的三项冠军或对百度强化自动驾驶能力有直接的助力。
以AutoNUE挑战赛的语义分割赛道为例,该赛道聚焦街景图像的语义分割。与普通语义分割数据集不同,街景数据集物体更多,场景更为复杂。针对该赛道的问题,百度提出了基于CNN和Transformer的融合算法策略,通过异构模型互补方式,实现了驾驶场景特征的更强表达能力,从而提升了分割性能。针对密集目标,百度提出了区域递进算法,将稠密任务切分为若干稀疏子任务,降低了模型复杂度,加速了模型收敛,提升了测试精度。最终,百度以三项测评指标均第一的优势超越其他参赛机构获得冠军。比赛代码也计划不久后开源: