bbs.geermuzixun.com

首页 » 常识 » 问答 » UP主的生产力工具,都藏在百度CV
TUhjnbcbe - 2024/12/13 17:46:00

机器之心原创

作者:张倩

CVPR上诞生的技术正在逐渐「出圈」。

啤酒、烧烤、欧洲杯是很多球迷今年夏天的消暑利器。但你可能想不到的是,那些精彩的进球集锦、球星慢动作回放说不定是AI做的。

在今年的CVPR大会上,百度向我们确认了这一点。

他们的AI可以在无人工介入的条件下,精准、实时地切分出进球、射门、犯规等动作片段。基于此项能力,团队开发出了一系列应用工具并成功落地,包括:

1.自定义足球精彩集锦生成工具。只需输入球员并选定比赛场次,AI就能自动生成这个球员的精彩瞬间视频集锦以及慢动作回放。相关产品已经在百度百科多个足球球员和球队页面落地。

2.足球图文战报一键转换视频平台。只需要输入文字直播内容或者直播间地址,AI就能智能聚合生成对应的视频内容。

3.基于图像场景识别的智能视频生产线。该生产线可以快速理解上传的长视频,检测是否有进球、精准定位视频中的进球瞬间,并完成自动剪辑。

最近,这些技术还帮他们拿到了一个重量级赛事的双料冠军。

在刚刚闭幕的CVPR大会上,百度取得了SoccerNet-v2足球视频理解竞赛的全部两项任务的冠军,这是全球首个以足球比赛视频的全方位理解为目标的竞赛。

而且,这还只是百度今年CVPR成绩单的一部分。

作为「中国军团」多年出征AI顶会的一员「老兵」,百度在今年的CVPR上再次创下新纪录:不仅入选了22篇优质论文,还连获10个挑战赛冠军,在去年8个冠军基础上实现新突破。

此外,百度还主办了一场重量级学术Workshop和一场Tutorial,并受邀在大会上做同声传译特邀报告和PaddleCV技术分享演讲。

这种全方位的发声方式不仅让我们看到了百度在CV领域的研究、落地成果,还展示了该公司在NLP、AutoDL等领域的前沿探索以及多个领域的融合创新。

在这篇文章中,我们就来盘点一下这些内容。

十项CV冠军,聚焦自动驾驶、智能交通、智慧城市、智能创作等多个赛道

CVPR覆盖了计算机视觉多个细分领域,百度此次参与并获得了七项挑战赛的十个冠军。其中,六项冠军成果可加速自动驾驶、智能交通、智慧城市等落地和应用,部分成果可助力智能创作工具的打造。

六项冠军助力自动驾驶、智能交通、智慧城市应用落地

对于百度来说,自动驾驶可以说是CVPR舞台上的一项「传统艺能」了。早在年,百度Apollo就占据了CVPR自动驾驶的主场;年,Apollo又在CVPR上公开了国内唯一的自动驾驶纯视觉城市道路闭环解决方案——ApolloLite。这些高光时刻在今年的多项竞赛中得到了延续。

在今年取得的十项冠军中,「语义分割、高分辨率人体解析、雾天环境检测」赛道的三项冠军或对百度强化自动驾驶能力有直接的助力。

以AutoNUE挑战赛的语义分割赛道为例,该赛道聚焦街景图像的语义分割。与普通语义分割数据集不同,街景数据集物体更多,场景更为复杂。针对该赛道的问题,百度提出了基于CNN和Transformer的融合算法策略,通过异构模型互补方式,实现了驾驶场景特征的更强表达能力,从而提升了分割性能。针对密集目标,百度提出了区域递进算法,将稠密任务切分为若干稀疏子任务,降低了模型复杂度,加速了模型收敛,提升了测试精度。最终,百度以三项测评指标均第一的优势超越其他参赛机构获得冠军。比赛代码也计划不久后开源:

1
查看完整版本: UP主的生产力工具,都藏在百度CV