百度做AI+视频的秘密和人工智能落地的N种可能
2018-06-01 15:25:22
  • 0
  • 0
  • 0

不久前的百度联盟生态峰会,一向低调的向海龙出来做了一个“新视代”的主题演讲。演讲内容多与视频有关,比如视频剪辑、视频制作等等,其中提到了很多百度AI的技术能力。

会后,很多人把它看作是百度进入视频领域尤其是短视频领域的征兆。这也不怪他们,主要是现在视频正火,被抖音、快手和腾讯的竞争所感染,百度又在重要的场合不谈AI谈视频,难免会有人联想一下。

实际上,如果你全程听完了向海龙的演讲就会发现,至少他这次演讲中的内容和现下正火的短视频完全不是一回事。

言简意赅的说,向海龙所表达的观点是AI赋能视频。

AI+视频成为可能,百度给视频插上AI的翅膀

向海龙在演讲里提到一件事,为何这么长时间视频一直没有成为主流的信息记录模式?他用四个难题概括了一下:生产难、存储难、传输难和检索难。四个难题我就不展开说了,着重讲一下解决办法。

智能手机的普及、网盘的诞生、移动网络和WIFI的提速以及AI技术的应用,是向海龙给出的四个解决办法。而这四个办法中,百度希望从其中两个入手,给视频插上AI的翅膀。

一个是视频生产,向海龙的演讲中列举了很多视频制作的方法,都是用百度的AI技术赋能制作工具,其核心目的是让复杂的视频制作简单化、傻瓜化。

比如在线视频的形体修正,可以让一个小胖子瞬间变得苗条。这就用到了百度的人体识别和形体美化的技术,可以自动识别视频当中的人体形象,在此基础上进行形体效果的再合成。

另一个是视频检索,这是一个比文字、图片检索更难的工作。在向海龙的演示里我们看到,百度AI已经可以做到完整分析出一段视频中的内容,如舞台、人物、物品、台词等信息,并把这些信息组合到一起生成标签,就像给一本书重新做了一个目录,可以检索定位信息所在的位置。

所以你看实际上百度做的工作是提供工具,让视频生产更简单、视频检索更高效。当然这也是有历史背景的,当下的视频领域多以强运营为主,也就是为用户提供尽可能多的创作手段好让UGC能够达到PGC的程度,简单来说就是让普通用户能随手拍出大片的感觉。

那么也许有人会问,为什么百度现在开始谈这个事情?我想答案有三,其一整个信息产业的进阶必定会令视频这种信息传输方式成为未来的主流,它会超越图文成为被广泛应用的信息传播媒介;其二,百度作为连接平台其实就是视频的传输管道,有责任有义务将管道修葺的更好更通畅;其三,为AI技术寻找合适的落地场景。

尤其是第三点,对百度AI技术的落地很有帮助。其实还有一个功能也是百度做AI+视频的优势,即智能分发。基于AI,百度的信息流业务实现了迅猛增长,同样也能延伸至视频领域。

百度AI赋能的N种场景,使其成为信息时代的“飞机”

至此,我们可以断定百度AI+视频本质上不是转型,而是站在更高维度赋能整个视频产业和扶持合作伙伴,如同互联网最初的工具使命一样。

站在大环境下看AI+视频,可能会更容易理解百度的做法。在互联网女皇一年一度的互联网趋势报告里,着重提到了短视频和长视频的迅猛发展。视频这种带有更丰富信息元素的媒介毫无疑问会是未来主流的信息传播模式,而信息传播拥有必要的三个节点生产、传播和接收,所以你看百度AI+视频其实就是围绕这三个节点来做事情。

向海龙提到的视频生产和检索,正是对应生产和接收,利用AI技术让用户能够更快更好的进行信息传播。

从实际业务的角度看,百度近年来一直在寻找AI落地的具体场景。最开始的百度大脑,帮助搜索引擎进行高效、精准的信息分发和智能识别,后来的Apollo计划和Duer OS也是在汽车和智能硬件的领域进行赋能,同样今天在视频领域,百度也是希望能够让AI技术以人们看得见、用得上的方式实现落地。

或者说,百度之所以选择在联盟生态峰会这样一个如此重要的场合来谈AI+视频,我猜最主要的原因就是希望能够让合作伙伴和更多的人看到,百度AI能力的孵化到达了哪个阶段,是实验室还是实际业务。

所以也就不难理解向海龙为何会在演讲中加入那几个视频案例了,因为这是百度AI能力的一个成人礼。

实际上,百度AI今天能做的事情已经很多,在AI+视频领域,如向海龙提到的形体美化、人体识别、语音识别、人景分离、语音合成等等;在AI+金融领域,百度金融也就是度小满拥有智能获客、身份识别、大数据风控、智能投顾等七大能力,还有AI+汽车、AI+智能硬件等等。

“AI+”的落地场景其实很有想象空间,单单在视频领域就不止现在的内容消费层面,未来在教育、医疗甚至O2O市场都存在巨大的市场机遇。比如教育与VR、AI的结合,就能让虚拟教师和远程教育的质量得到全面提升。

可以设想一下,一个北京四中的优秀老师可以给分布在全国各地的几万名学生同时上课,而且通过人工智能的辅助,老师可以知道每一个人的理解程度,并且进行相应的交互沟通,这种跨越空间和时间的沟通将完全打破现在的教育格局。

所以,AI同互联网本质是相同的,它提供了更加高效、立体的呈现方式,为所有的应用和程序提供一个基础架构。我打个比方,如果说互联网是信息时代的“高速公路”,那么AI就是“飞机”,是信息时代的新基建设施。

再回到AI+视频的事情上来,就更容易理解了。向海龙所讲的AI+视频,其实就是百度为合作伙伴提供的一种灵活且具有弹性的服务和工具,是百度AI技术的一种应用体现。

以往谈论AI,我们可能会更多关注AI技术本身,忽略了AI的落地和应用场景。而百度这次着重引出AI+视频技术的落地,就是向外界传递一个观念,未来借助AI对其他行业进行赋能的大幕已经拉起,AI+视频只是一个起步。

 
最新文章
相关阅读