AI 视频爆火!一张照片生成任意动作视频,太离谱了

article/2025/6/8 4:58:18

今天早上工作群里的一个动图,把大家的睡眼惺忪直接「炸」成了目瞪口呆。

这段蒙娜丽莎做瑜伽的短片,由 MagicAnimate 生成,这把许多人想一夜学会做视频的「白日梦」带到了现实里:现在只需要提供一张照片,就能生成指定动画视频。

单从效果看,AI 在生成领域的深耕,好像已经在专业视频的高墙上,凿出了一个巨大的门洞,从业者和爱好者都能在城里城外,穿梭自如。

模仿动画,也是魔法动画

MagicAnimate 是新加坡国立大学和字节跳动联合推出的「人体图像动画生成器」,能够把指定的人物图片按照既定动作序列生成视频。

只需要选择指定的图片和动作,就可以产出对应的动效短片。这时候发挥你的奇思妙想,许多名作的二创,又会因为你「无厘头」变得有趣起来。

戴珍珠耳环的斯文少女,也可以有活泼的一面。

和朋友约好的舞蹈课她又放了鸽子,没关系,她今天高低也得跳两下。

这两天和 MagicAnimate 一起冲上热搜的,还有另外两个明星选手,从其背后的创作团队看 —— 阿里、Google —— 就知道这是继大数据云计算、自然对话语言大模型后的,又一次大厂技术厮杀。

无论是照片中的真人,还是火影忍者的暴躁纲手,亦或在铁皮躯壳下的略带闷骚的 Iron Man,只要你有让它动起来的需求,在阿里优化的扩散模型中,静态人物都能生成动态视频。

甚至在阿里这里,你还可以为自己上传不同的服饰搭配,配合着模特的展示动作,在电脑前就能搭配出接下来一周的 OOTD。

Google 和前两位运用大体相似的技术逻辑下,在「The Chosen One」中对图像的一致性生成效果更有执念。

给 The Chosen One 一张图片,它还你一次环球旅行。

通过对你上传照片的特征分析, Google 的技能把你放进任何场景里,并且根据场景的变化搭配不同的衣服和动作,你也可以输入文本来生成对应的场景,相当于一个增强版的「DALL·E」。

真实感体现在细节上,比如上图最右侧的「在沙滩上」的照片,一个眯眼咧嘴的笑,将沙滩上烈阳高照体现地淋漓尽致,尽管没看到太阳但也能感受到那份刺眼。

画面的主角可以是你,也可以是你的宠物。

当拟人化的动物走进了画面,那这样的作品就能走进动漫作品和儿童读物。

把「卡通形象」和「真实场景」结合一下, 类似 AR 的效果虽然拍不出《空中大灌篮》这样的融合大制作,但来一张类似的合影,现在也不是什么难事。也难怪 Pixel 8 会有难得的口碑,对 AI 图像生成的研究,Google 是真没少下功夫。

接近现实,是终极目标

三者的技术语言和模型都略有不同,MagicAnimate 通过「视频扩散模型」捕捉时间信息、「外观编码器」保持外观一致性来生成流畅的画面。

二者再通过视频融合技术,确保长视频动画过程中的平滑过渡。专业术语有点懵没关系,和传统技术对比一下就能直观感受新科技的魔法。

MagicAnimate 的创作优化,即使在在挑战性极高的 TikTok 舞蹈数据集上,成像的真实度比最强基线还高了 38%。最右列的视频在对比下,还原度和真实性的确是当中佼佼者。

我本想用「马斯克 + 热舞」验证一下这个 38% 的真实性,在生成器中上传照片和动作后,很遗憾截止发稿前我都没能排上号,有种 10 点之后排队吃海底捞,但没「黑卡」的无奈。

阿里团队的「Animate Anyone」通过程序算法提升模型在「时间」「空间」「交叉」维度上的注意力,以此达到逼真的成像效果。

成果展示是对专业技术最好的解释,通过 Animate Anyone 的创作,我们可以看到与 MagicAnimate 相似的效果,甚至在人物面部保持上,阿里团队在展示成品中,做得更出众。

但不管用上了怎样的复杂技术,其目的都在指向一个生成效果:「保持多视图一致性」。

我们用最直观的方式来把这个复杂的技术尽量解释清楚:在视频制作特别是动漫制作中,人物的动作是通过逐帧过渡完成的,原理类似于小时候经常玩的手翻书,每一页都是静态的手绘稿,快速翻动就能通过人眼「视觉暂留」的 BUG 让画面动起来。

手翻书原理展示. 图片来自:@翻页书安迪Andymation

因此在制作虚拟形象之前,会用「三视图」作为基准点,将人物的其他动作补充完整,早些年的一些 AI 高清视频就是在原有的帧数基础上用「暴力加帧」的方式,来获得更高清、连贯的成像效果。

上述三家公司正在攻克的「扩散模型」,最大的难点是用仅有的一张图片,来自动「脑补」接下来的动作和场景,并且前后都没有参照物。

所以官方的对比展示中,看到传统技术「DisCO」被作为反面教材反复鞭打,其严重的失真效果只能做到让主体动起来,但扭曲的身型和奇怪的动效完全称不上作品。

当然这也侧面看出了字节、阿里和 Google 在「一致性」保持中的突破性成就,对 AI 生成的视频最大的夸奖,就是很逼真。

吹毛求疵地对比了三家的前沿技术,尽管在主体的细节把控上还略有失真,但和以前相比已经有了彻底的变化,起码「黑科技」引入短视频平台时,会有相当多的创作者会使用它们作为下一个成品的创作工具,产品从 PPT 走到现实,最终还是依靠过硬的本领。

在翻阅 MagicAnimate 的论文时,摘要最后的一句话,有种似曾相识的感觉

Code and model will be made available.

这并不是字节第一个开源的项目,在此之前其已经公开了 Magic 家族中的另外两项技术的代码:「MagicEdit」「MagicAvatar」

创造魔法,用这三板斧

用 MagicAnimate 一个软件来和其他两家的技术比较,似乎没有显现出像网上讨论的那般优势,但集齐「Animate」「Edit」「Avatar」这三板斧,字节跳动在视频生成的创新中,就有些「摇摇领先」的趋势了。

MagicAvatar 是视频界的 DALL·E,并且是超级加倍的版本,最基础的功能就是用文本生成指定的动图,这和 GPT 的图像生成大同小异,只是生成对象不同。

进阶的使用方式,给定一个源视频,再输入想呈现的效果,你会打开新世界的大门,甚至会有一种「奥斯卡有手就行」的蜜汁自信。

看看 MagicAvatar 给出的答卷,你就能懂得这种自信不是空穴来风,成像真的很逼真。

当然还有一种混合玩法,就是在文章开头 MagicAnimate 所展示的能力:静态图片通过指令生成动态视频。

MagicEdit 在三者当中的定位更加通用,通过高保真度和时间连贯性来生成视频的编辑工具,在不改变视频整体动作进程的基础上,调节视频当中的部分元素,如「颜色」「天气」「主体种类」来生成一幅新作。

生成过程中也会创造出一些有点违和的物种,比如「虎兔」「狗猫」。这是我们最喜闻乐见的环节,这种「失误」也往往能给这些人工智能的新技术带来再一次热度。

印象最深的是这个场景扩充的功能,不仅能给较小的视频画面增添画幅、扩充背景,还可以把增加后的主体缺失部分完全补齐。

跑步的帅哥到底穿长裤还是短裤,画幅横着还是竖着现在都由你说的算。

抖音当中已经加入了类似的 AI 扩图模版,经过我们的实测效果不错,但评论区翻车的场景应该会比任何一个正常生成的案例都能让你记忆犹新。

不用去考究这些失败作品的真实性,因为在大家愿意将其作为笑点中心的时候, AI 生成视频的第一个目的就已经达到了:去体验新的技术,并且参与在其中。

新的可能,在新技术里

一天之内翻阅了各大公司在视频「扩散模型」的最新成就,算不上打开了新世界的大门,但接近真实的生成效果仍然能让我留下深刻的印象。

但从新技术的新鲜感中跳脱出来,会有一种「这能干吗」的强烈疑问。

2023典型媒体用户活跃度规模统计. 图片来自:questmobile.com

这是截止到 2023 年 9 月,抖音、快手、小红书、哔哩哔哩、微博五大典型新媒体平台去重活跃用户统计,总规模达到 10.88 亿,渗透率将近 90%,短视频已经成为了网民「触网」的首要应用。

其中有超 1.5 亿网络直播账号、超 10 亿内容创作者账号,即使你我都不是视频的创作者,但你我的身边遍布着视频生产者。

如此庞大的观众数量需要有更多元的视频内容来填充我们的浏览需求,而如此硕大的创作需求也要有更多的新技术来激发制作人的创意和灵感。

依靠 AI 视频生成、一致性保持技术,我们的确可以在不久的将来,看到更多的创作者因为新科技打开更多的创作灵感,也会因为震撼的视效带给网民更高质量的冲浪内容,今后的大片特效不再是专业导演和剪辑师的专属,有创意的你用手边的电脑,也能给短视频注入更多的可能性。

以上的所有技术,就是在给短视频和创作者,创造新可能。


http://www.hkcw.cn/article/gOUXSxFJwt.shtml

相关文章

通车快十年,关于上海长江隧桥你了解多少?

上海长江大桥 简 介 上海长江隧桥于2009年10月31日正式通车,是上海长江大桥、上海长江隧道的统称,又称崇明越江通道、沪崇通道工程,为目前世界上规模最大的隧桥结合工程,是国家重点公路建设规划中上海至西昌高速公路的过长江通道之一,全长25.5公里,采用“南隧北桥”方案,…

原创4-0!欧冠5冠王太强,6次吊打国王杯冠军,签9000万前锋,冲冠军

2024/25赛季欧洲5大联赛继续进行,对于巴萨来说,新赛季换帅,并且遭遇拥有姆巴佩的皇马,双重压力之下,巴萨的前景如何是球迷关注的焦点。北京时间8月25日凌晨1点,西甲第二轮的一场比赛中,巴萨将坐镇主场迎战上赛季国王杯冠军毕尔巴鄂竞技,这是巴萨在新赛季的主场首秀,由…

《英雄联盟》2016季中赛MSI各国赛区战队赛程一览

原标题:LOL2016季中赛MSI各国赛区战队赛程一览 2016季中冠军赛(简称:MSI)是《英雄联盟》三大全球顶尖赛事之一,5月4日至15日本届季中赛将在上海东方体育中心举行,来自全球六大赛区的六支冠军战队将汇集上海向冠军荣耀发起冲击。 目前,各大赛区晋级季中冠军赛的战队名单已…

退役军人化身“救火先锋”!好样的!

今年40岁的退役军人徐东 是新北区薛家镇新晨社区的 一名网格员、调解员 更是小区居民的贴心人 每一天 他带着一个本子、一支笔 穿梭在社区楼宇之间 详细记录社情民意 一张嘴说和百家事 一双腿踏出和谐路 兢兢业业地为百姓排忧解难 “看不到他的身影,我出门买菜都不放心。”住在…

台州一家四口搬进新家才两天,被写全家死光**

来源:玉环公安 版权归原作者所有,如有侵权请联系我们 原标题:前房主欠钱,男子讨债的姿势不对,结果把自己送进了看守所 庄先生两个月前在坎门街道某小区买了一间二手房,收拾过后,在七月初选了个好日子搬家入住。原本这是一件高兴事,但一家四口才住了两天,心情却直接down到…

化疗病人适合戴的假发

化疗病人适合戴什么样的假发,应根据个人的需求和偏好来决定,同时需要特别关注舒适度、逼真度以及方便性,以确保假发能够既自然又舒适地融入他们的日常生活,根据网上多个平台数据显示,以下是一些适合化疗病人戴的假发特点:化疗病人假发定制:183 9090 5556(+微信)化疗专…

江宏恩与段宗宣的爱情故事

: 在娱乐圈中,有一对夫妻引起了网友们的关注,他们就是江宏恩和段宗宣。两人结婚五年,但没有生育孩子,这让很多人产生了疑问:江宏恩是否会因为江祖平的存在而感到意难平? 江祖平曾是台湾的第一古装扮相女神,她的美貌和气质吸引了众多粉丝。而在江宏恩的生活中,江祖平也扮…

原创马纳罗拉:为何成为意大利岩石间的迷人村落?

文|贾文彬的史书 编辑|贾文彬的史书 马纳罗拉,位于意大利阿马尔菲海岸的一个迷人村落,以其独特的地理环境和迷人的建筑风格而闻名,嵌在悬崖峭壁之间,马纳罗拉以其绝美的景观和古老的历史,而吸引了无数游客的目光。 这个岩石间的村落为我们展示了意大利独特的文化和风情,同…

速度与激情8里的帅哥与豪车,却遭豆瓣网友鄙视?

根据中新社洛杉矶4月30日电 (记者 张朔)最新统计数据显示,《速度与激情8》不仅仅是赢得北美票房三连冠,而且全球票房更已突破十亿美元。《速度与激情8》是《速度与激情》系列电影的第八部,由美国环球影业发行,F加里格雷执导。 是由范迪塞尔、道恩强森、杰森斯坦森、查理兹塞…

杜海涛背后的神秘力量江南首富父亲的传奇故事

近日,杜海涛父母的真实身份被曝光,引发了广泛关注。据悉,他的父亲是杜国豪,被誉为“江南第一首富”,拥有庞大的产业帝国,资产甚至与万达相媲美。然而,由于杜海涛从未公开透露过有关父亲的消息,所以在节目中当嘉宾提及此事时,他也并未予以否认,这使得实际情况变得扑朔…

发膜比较好的品牌有哪些?医生十大最建议买的发膜!

之前我的头发因为漂染太多次,导致发尾又干又燥,长期处于摆烂状态。用了很多护发产品都没啥用!后面就经常去美发沙龙做护理,三番两次的就跟Tony老师熟络了起来,后面他告诉我可以试试用发膜护理头发。不用不知道,一用仿佛打开新世界的大门!原来发膜对于改善发质那么有用,…

《大众软件》众筹逆天:免费送2014年至今电子版

“情怀”二字在《大众软件》的众筹过程中体现的淋漓尽致。其设定的6000元众筹目标,活动刚开始的不久后就达成了。 至截稿前,其在摩点网上的众筹支持人数已经突破五万人,众筹金额超过70万。 为了感谢读者的支持,《 大众软件》官方日前发布公告,决定将免费提供2014年至今的…

新生指南 | 新生必备在校网站合辑

熟知长大的各个官方网站及其用途是成为一名合格CHDer的重要一步,贴心小编整理了一份“长大官网合集”,看看有哪些你还不知道的宝藏网站! 官网 https://www.chd.edu.cn长大官网示意图 长安大学官网是获得 长大的一手新闻、要闻的最佳网站,同时也可以通过官网丰富的导航栏和快…

原创这谁顶得住!42岁蔡妍,典雅迷人写真曝光,美得不可方物!

这谁顶得住!42岁蔡妍,典雅迷人写真曝光,美得不可方物!在这个看脸的时代,似乎岁月已经不再是衡量一个女人魅力的标准。而42岁的蔡妍,却用她的身材、锻炼、外貌和性感,再次证明了年龄不是问题,美丽永不过时。身材:完美曲线,散发女人味展开全文蔡妍的身材一直以来都是她…

魔蝎大帝感人退役,赛后感言走进人心,摔角生涯谢幕圆满收官!

摔角界的传奇人物“魔蝎大帝”斯汀在AEWRevolution的告别战中展现出了令人难忘的绝唱。这位摔角名人堂成员和搭档,在历史悠久的格林斯伯勒体育馆与羊拔兄弟争夺AEW双打冠军头衔。16000名粉丝见证了这场告别战的精彩一幕。斯汀的入场可谓大片级别,他坐在空荡荡的电影院里,通过…

基金项目:台湾鳖工厂化水泥池繁、养殖技术

基金项目:台湾鳖工厂化水泥池繁、养殖技术 基金项目:台湾鳖工厂化水泥池繁、养殖技术 _王飞飞 目前,台湾鳖繁、养殖模式主要有土池粗养、混养、水泥池精养、冬季棚架式加温、保温养殖等多种形式,其中水泥池工厂化温室繁、养殖模式发展较为迅速,主要因为繁、养殖条件易操控…

事关期刊审读通过率!编校“出版形式”的注意事项

出版形式是期刊的门面担当,也是期刊重要信息的载体。《报纸期刊质量管理规定》中指出,期刊质量包括内容质量、编校质量、出版形式质量、印制质量四项,四项中有一项不合格的,期刊质量为不合格。期刊出版形式差错数超过五个的,其出版形式质量为不合格。根据《报纸期刊质量管…

创维推出A5D Pro 4K Mini-LED电视:可选55-85英寸、内置回音壁,2999元起

2024-03-28 16:38:42 作者:姚立伟 创维A5D Pro Mini-LED电视京东上架 4月7日开售 55英寸2999元,65英寸4399元,75英寸5799元,85英寸7799元。 这款电视采用京东方S+ 4K Mini-LED面板,拥有高达480个独立控光分区(85英寸,75英寸为392个),每个分区都由双芯16晶微米级发光芯…

什么是烟标?烟标收藏的四大价值,你知道吗?

说起烟标,抽烟的朋友相信你都不陌生,就算说不出具体描述什么是烟标? 也会指着香烟盒告诉告诉你那是独具特色的民族烟标,烟标收藏价值是什么?为什么全世界都有烟标收藏者?下面中国香烟网小编为大家整理介绍。 什么是烟标 自从烟草进入了人类生活,它的生产、消费以及吸烟习…

2023年全国中学生物理竞赛复赛真题及答案新鲜出炉!来看难度如何

2023年全国中学生物理竞赛复赛理论考试已经结束,小德在第一时间为大家带来本次理论考试真题,一起来看吧! 理论试题展开全文参考答案来源 | 全国中学生物理竞赛委员会 版权归原作者所有 德华盛仅用于非商业性分享 如有侵权请联系删除