关闭广告

字节跳动OmniHuman:静态照片秒变生动视频

科技行者2025-08-27 00:00:01492人阅读


音乐、说话、手势、表情——只需一张照片和一段音频,就能让静态的人物照片瞬间活起来。这听起来像是科幻电影里的情节,但现在已经成为现实。ByteDance的研究团队在2025年6月发表了一项名为"OmniHuman-1: Rethinking the Scaling-Up of One-Stage Conditioned Human Animation Models"的重要研究成果,该研究由字节跳动的林高杰、姜建文、杨佳琦、郑泽荣、梁超等研究人员共同完成,已发表在arXiv平台(论文编号:arXiv:2502.01061v3),有兴趣深入了解的读者可以通过https://omnihuman-lab.github.io/访问项目详情。

这项研究解决了一个普通人都能理解的问题:如何让静态照片中的人物"动起来"。以前,制作一个人物说话或唱歌的视频需要复杂的设备和专业技术,现在只需要一张照片和想要的音频内容,

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

外国游客被中国震醒:原来欧洲如此落后

澎湃新闻 浏览 68252 08-31

无名花丨诗一首

正经社 浏览 217 10-31

三星单季利润暴增208%

21世纪经济报道 浏览 242 01-09

7万级方盒子,后独悬+Flyme Auto,吉利牛仔不讲武德

盖世汽车 浏览 35 06-01

A股重返3700点!券商后续行情如何演绎?

天下财道社 浏览 401 08-22

15元/次能抽到陌生男人证件照、通缉令甚至丁字裤,东亚社畜专属盲盒“真把我当日本人整”了?

Vista氢商业 浏览 689 07-28

《冰湖重生》被曝补拍!黄杨钿甜宣传未出镜,网友想看原定小楚乔

萌神木木 浏览 1878 07-17

利物浦签下23岁前锋埃基蒂克 转会费总价9500万欧

懂球帝 浏览 4971 07-24

开源版Cowork爆火,逼得Anthropic下放Cowork

新智元 浏览 260 01-19

火狐浏览器黯然退出,一代王者为啥不火了?

江瀚视野 浏览 477 08-11

华汇智能:新增业务布局或晚于同行 自称核心技术专利自主研发或现信披疑云

金证研 浏览 447 09-10

荣威M7 DMH发布全新车色"慕斯白" 预计下半年上市

网易汽车 浏览 10470 07-09

以方袭击后 美副总统表态:加沙停火协议仍在维持

国际在线 浏览 366 10-29

吉利银河 A7 逆袭称王 单周狂甩 4195 辆

大象新闻 浏览 526 08-20

月之暗面推出新模型,业内人士:大模型低价竞争策略不会长久

澎湃新闻 浏览 3014 07-15

内德维德:我一直很喜欢加斯佩里尼,罗马有这样的教练是幸运

懂球帝 浏览 323 10-24

内娱有自己的肯豆,她的度假日记好对味

时尚COSMO 浏览 435 08-16

厘清“避债”误区!保险保单可以被法院执行

券商中国 浏览 4611 08-10

陈伟霆何穗官宣结婚生子,夫妻俩抱娃露面幸福满溢,二人隐藏好深

扒虾侃娱 浏览 330 10-18

23家湾区企业上榜世界500强,华为重回前100

21世纪经济报道 浏览 6964 07-30

马英九祝贺郑丽文当选:坚守"九二共识" 促进两岸关系

参考消息 浏览 298 10-20
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11