AI剪辑的“so great” 和“too weak”

智能相对论

    今年世界杯迄今为止最大冷门,无疑是卫冕冠军德国 0:1 爆冷负于墨西哥,险些0:2甚至0:3。世界杯的魅力就是永远会发生各种看似各种不可能的事,因此,留下了不少让球迷津津乐道的精彩瞬间。
    如何快速将这些精彩快速集合,二次引爆球迷呢?
    某视频网站在6月14日世界杯揭幕赛前正式发布最新“AI黑科技”— AI直播剪辑官,参与世界杯直播精彩短视频实时剪辑。事实上,在年初的2018足协杯资格赛上,人工智能剪辑就被运用,全部自动化完成,不需要人工操作审核,实时捕捉、实时剪辑。
    不仅在体育上,AI剪辑最早是被应用在电影制作上,但是在这两者上的应用上却有一定的差异,并呈现一系列问题,下面笔者将据此进行分析。
    AI剪辑体育视频“so great”,剪辑电影就”too weak“
    说起电影剪辑,不得不提王家卫。据说他拍电影不用剧本,全靠后期剪辑。张曼玉曾在拍《花样年华》接受记者采访时坦言,“拍他的戏很无奈,因为你永远不会知道他下一步会怎样走,根本无法准备。不过,每次看完剪片,我都会有意外惊喜,很开心。”
    这充分说明了剪辑在电影中的重要地位,类似于观音菩萨捏泥人造人时,最后吹的那口让泥人成真人的一口气。
    体育往往是肢体运动,AI 在剪辑前更多的是人脸识别和对相关动作的学习,但是电影是对白艺术,不仅是人脸识别还有语音语义识别。同时,体育运动是在既定的规则框架下进行的,AI不需要花费时间去去判断是否犯规,而在AI剪辑电影前,需要判断表演的好坏和拍摄的质量,还要能识别出穿帮镜头。二者的难度系数可想而知。
    因此,AI剪辑现阶段在体育领域的使用会远远高于在在电影领域的使用,在电影剪辑里,它更多的是作为一个辅助者。
    早前IBM的人工智能系统Watson曾为电影《Morgan》剪辑预告片。
    具体流程是先给Watson看100部恐怖电影预告片,准确的说,是这些影片的切割片段或单独场景。Watson对这些预告片进行了画面、声音、创作构成的分析,并标记上对应的情感。随后,工作人员将电影《Morgan》导入,Watson迅速挑出了其中10个场景组成了一段长达6分钟的影片。最后在剪辑师的帮助下,这些镜头被剪辑成最终的成片。
    该预告片谈不上优秀,甚至有点“土”而无“味”。但是在营销和制作周期上的意义影响深远,本应10天到1个月的制作周期缩减到了24小时,获得了极大的曝光。除此之外并没有特别的意义,《Morgen》于2016年上映,在此之后鲜少听闻有电影用人工智能做预告片
    AI剪辑更多是“成品“不是”作品“
    据说战地记者在拍摄的时候,有时候会因为不熟悉情况没法获取一手资料,而这个时候如果托当地人去拍摄就会容易得多。对看新闻的人而言,他们不会太关心这段视频是不是抖动得厉害,画质是否不清晰,只要这个新闻事件被完整呈现。
    显然对很多球迷而言,呈现的意义比创作更大。能及时看到世界杯的进球和精彩合集是最重要的,再配上足够激动人心的音乐,球迷并不会在意其他。
    2018赛季NBA总决赛尘埃落定后,有视频网站实时上线了《杜兰特11年精彩回顾》。球迷对这部片子的要求不亚于对一部电影的标准,但是扪心自问,它绝对算不得一部精彩的剪辑,全程节奏平淡,层次感不清晰,看完内心毫无波澜。好的剪辑可以直戳人心,而AI剪辑显然和优秀的剪辑师还有一段距离,AI剪辑的仅仅是“成品”而不是“作品”。
    AI剪辑的发展轨迹
    影视剪辑不仅重要,而且比较程式化,非常耗时。而 AI 的加持无疑有利于提升剪辑视频的效率,智能相对论的分析师雷宇认为,AI剪辑大体按照以下三个运行轨迹发展。
    第一步:画面识别,缩短素材收集时间
    这是AI对视频最基础的认知,这里的 AI 识别的主要是辨认视频画面中的对象。以世界杯为例,主要就是对高速运动下的球星人脸实时定位与检测,如这段视频几秒至几秒出现的球星是梅西,这一段是阿圭罗等,并能将他们的视频提取出来。
    2016年Miles Deep 则使用了特殊的深度卷积神经网络,可以取其精华去其糟粕,更方便你看小黄片。它可以移除所有不包含性接触的场景,或者编辑去掉一种特定的性行为,是一个很好用的色情视频分类或编辑工具。
    另一方面,有数据显示,2025年全球数据量将达到163ZB ,这对人来说整理视频数据将越来越麻烦,但对AI来说,已经能够轻松做到从全网提取出包含特定关键词内容的视频片段,并截取出来统一进行分类整理,这一步的AI类似于一个小秘书。
    第二步:理解镜头语言,学习人类的镜头剪辑
    AI需要对视频的理解深入到镜头的内容及镜头语言的运用,学习剪辑规则,通过深度学习模仿人类的剪辑技巧,实现基本的剪辑。如在世界杯中,它需要准确识别进球、射门、角球、红牌、黄牌、庆祝等多种动作,模仿人自动剪辑出进球、射门、犯规、过人等精彩片段。
    以我们常常吐槽的制作粗糙的网络剧为例,素材和成片比例大概是10:1,剪辑师剪辑起来可能不那么耗费精力。但是真人秀节目就不同了,素材与成本的比例非常惊人,例如《爸爸去哪儿》摄制组共有40多个机位,大全景、大特写、小全景等多个景别同时开拍,每集90分钟的节目都有1000多小时的素材。如何前期从几十台机位的素材中快速找到最终剪辑需要的镜头,是相当费时费力的过程,而AI 的使用可以辅助人筛选,最终简化这一流程。
    第三步:在某种程度上替代人,做一些具有创造性的活。
    这要求AI能自行能够理清素材间的联系,根据学习的镜头组接规则,面向特定目标自动进行视频的剪辑。经典好莱坞电影拍摄手法一般是拍摄一个远景作为主镜头,然后再分别拍摄特写镜头、反应镜头、切入镜头和切离镜头,最后剪辑师依据需求进行剪辑。
    一个来自斯坦福大学和Adobe公司的AI便能够自行同步相同场景的录像。然后自动识别和分析演员所体现出的人物形象,最后根据导演对风格的要求,AI依据数据库里较为成熟的剪辑风格和镜头语言对录像进行自动选择和组装。
    
    图为四种不同形式的剪辑
    它仅仅3秒钟就剪出了一个71s的视频,而一个经验丰富的剪辑师可能需要好几个小时。但是剪辑质量如何,最关键的地方却没有细说,很微妙。
    结尾
    毫无疑问,AI剪辑已经越来越广泛渗入到了文体产业,从第一部电影诞生至今,电影影视工业不断的走向成熟和便捷。剪辑因早一批的剪辑师用剪刀剪断录像胶卷后拼接成像而得名,随着电影电视数码化,剪辑师的工具从剪刀变成了电脑,AI剪辑让剪辑师手里的工具更加的方便,利于他们创作出更多更优秀的作品。
    但是,在让剪辑师更加便捷工作的同时,也让剪辑师的职业门槛不断降低,越来越多的人可以制作视频,电影电视的制作周期可能会更短,至于质量?粉丝买单就成。