类Sora模型到底懂不懂物理?字节完成系统性实验证明
Sora爆火以来,模明“视频生成模型到底懂不懂物理规律”受到热议,型到系统性实但业界一直未有研究证实。底懂近日,不懂字节跳动豆包大模型团队公布最新论文,物理完成研究历时8个月,字节围绕“视频生成模型距离世界模型有多远”首次在业界完成系统性实验并给出明确结论:视频生成模型可以记忆训练案例,验证但暂时还无法真正理解物理规律,模明做到“举一反三”。型到系统性实
图灵奖得主、底懂Meta首席AI科学家杨立昆点赞并转发了该研究,不懂表示“结论不令人意外,物理完成但很高兴终于有人做了这个尝试!字节”
自OpenAI发布Sora模型以来,验证很多视频生成模型都会强调其生成结果对物理规律的模明遵循。豆包大模型视觉团队相关小组,对视频生成模型究竟能否从视觉数据中“发现”并“理解”物理定律感到好奇,决定深入研究。
历时8个月,该团队完成了业界首个系统性的实验研究。团队通过专门开发的物理引擎合成了匀速直接运动、小球碰撞、抛物线运动等经典物理场景的运动视频,用于训练基于主流DiT架构的视频生成模型。然后,通过检验模型后续生成的视频在运动和碰撞方面是否符合力学定律,判断模型是否真正理解了物理规律,并具有“世界模型”的潜力。
实验中设计的不同运动场景
豆包大模型团队的实验发现,即使遵循“Scaling Law”增大模型参数规模和数据量,模型依然无法抽象出一般物理规则,做到真正“理解”。
以最简单的匀速直线运动为例,当模型学习了不同速度下小球保持匀速直线运动的训练数据后,给定初始几帧,要求模型生成小球在训练集速度区间内匀速直线运动的视频,随着模型参数和训练数据量的增加,生成的视频逐渐更符合物理规律。
然而,当要求模型生成未曾见过的速度区间(即超出训练数据范围)的运动视频时,模型突然不再遵循物理规律,并且无论如何增加模型参数或训练数据,生成的结果都没有显著改进。这表明,视频生成模型无法真正理解物理规律,也无法将这些规律泛化应用到全新的场景中。
通过进一步的实验分析,研究团队得出结论,“生成新视频时,模型主要依赖对训练案例的记忆和匹配。视频生成模型就像一个只会‘抄作业’的学生,一旦遇到从未见过的场景,如不同大小、速度的物体相互作用,就会‘犯迷糊’,生成结果与物理规则不符。”
不过,研究中也有一个好消息:如果训练视频中所有概念和物体都是模型已熟悉的,此时加大训练视频的复杂度,比如组合增加物体间的物理交互,通过加大训练数据,模型对物理规律的遵循将越来越好。这一结果可为视频生成模型继续提升表现提供启发。
据了解,本研究两位核心一作都非常年轻,一位是95后,一位是00后,在豆包大模型团队专注视觉领域的基础研究工作。作者们一直对世界模型感兴趣,在8个月的探索中,他们阅读了大量物理学研究文献,也尝试从游戏中获得研发灵感,历经多次失败后,最终一步步确定研究思路和实验方法。
友链
外链
互链
Copyright © 2023 Powered by
六合彩图库源码【购买联系电报bc3979】AC彩票网站源码|六合彩源码|彩票搭建|新中原六合彩源码|【网站bc9797.com】六合彩论坛源码【联系飞机bc3979】
sitemap
-
文章
39824
-
浏览
1791
-
获赞
48
热门推荐
-
《惊天魔盗团3》主演手指受伤 不仅有魔术还有很多动作戏
在前两部电影中饰演了主角丹尼的杰西·艾森伯格将回归《惊天魔盗团3》。最近他带伤现身了伦敦 BFI电影节,参加与基南·卡尔金联合主演的电影《真正的痛苦》的红毯首映式。接受 GamesRadar+ 采访时时尚服装平铺图(服装平铺图片)
时尚服装平铺图服装平铺图片)来源:时尚服装网阅读:330平铺拍摄裤子:如何拍出美感?1、让宝贝图片变漂亮的拍摄技巧平铺拍摄裤子:如何拍出美感? 裤子特别是牛仔裤在拍摄之前要先熨烫,摆放时折叠先一下,拍去年中国用水总量保持在6000亿立方米左右
记者近日从水利部获悉:初步统计显示,2023年我国用水总量保持在6000亿立方米左右。这意味着,2014年以来,我国国内生产总值增长近一倍的情况下,用水总量总体稳定在6100亿立方米以内;与2014年女生用的很酷签名 气质十足的签名
日期:2023/7/20 15:43:00作者:网友整理人气:0我来评论导读:这组女生的签名真的好酷呀,气质也是数一数二的哦,希望每个女生的内心都住一个强大且霸气的自己。 自拍这种东西,三分《如龙》真人剧花絮曝光 神室町场景完美还原
SEGA近日发布了《如龙》真人电视剧的幕后制作花絮视频,揭秘了剧组如何在现实中重现游戏标志性场景——神室町的幕后故事。 《如龙》真人电视剧制作花絮:视频展现了剧组在东京近郊大规模搭建神室町场景的幕后工朱瞻基有几个儿子:只有两个儿子(朱祁镇和朱祁钰)
明朝是历史上一个非常重要的朝代,首先明朝开国皇帝朱元璋就十分神奇,开始的时候他十分贫穷,后来才逐渐变得十分厉害,最终成为了皇帝,而明朝之后的皇帝也有许多传奇故事,其中朱瞻基的故事也是非常传奇的,那么接《别跑!美女在追你》在Steam正式发售 优惠价20元
今日(3月25日)真人互动影像游戏《别跑!美女在追你!》正式发售,首发优惠仅售19.8元,活动截至到4月1日结束。Steam商店地址:点击进入《别跑_美女在追你》是一款全新的第一人称沉浸式真实互动影像【东海期货4月18日产业链日报】能化篇:需求短期偏软叠加美元反弹,油价周一回调
汇通财经APP讯——原油: 需求短期偏软叠加美元反弹,油价回调。沥青:排产有所减少,库存保持平稳。乙二醇:原料成本拉低驱动减弱,短期去库后继续窄幅震荡。甲醇:供应压力难以有效缓解,价格依然偏弱。 橡胶整顿网络经营乱象 北京丰台强化电商企业监管
中国消费者报北京讯徐艳记者董芳忠)近年来,网络电商经营领域乱象日益突出,网络消费纠纷大幅增多,已经成为广大消费者反映强烈、民生领域堵点之一。为切实维护广大消费者合法权益,确保为民办实事早见效、见实效,穿越火线cg大片,穿越火线:掀起CG革命,探寻游戏大片的震撼魅力
穿越火线系列CG动画,是由官方推出的一种游戏宣传动画,通过动画的形式来宣传游戏,介绍游戏玩法和角色等。穿越火线的CG动画可以在官方网站,或者各大视频网站上搜索就可以看到。穿越火线:掀起CG革命,探寻游Needles x Noma T.D. 2022 春夏联乘系列明日开售
潮牌汇 / 潮流资讯 / Needles x Noma T.D. 2022 春夏联乘系列明日开售2022年04月01日浏览:2337 由野口雅子和佐佐木拓共同创立的日本莫拉蒂:对斯内德转会一事满意
1月21日米兰消息 - 马西莫·莫拉蒂周一上午在办公室外接受了众多记者的采访。以下是莫拉蒂的所有言论:我是否可以说你的介入对斯内德转会的最终完成起到了推动作用?“我是俱乐部的一员,大家都知于大宝:12强赛没有一场容易的比赛 结果才是最重要的
于大宝:12强赛没有一场容易的比赛 结果才是最重要的_中国队www.ty42.com 日期:2021-10-08 22:01:00| 评论(已有305958条评论)煤气化装置在线分析仪表中标结果公告
【化工仪器网 市场商机】项目名称:安庆碳一板块安全环保提升及节能优化改造-煤气化装置在线分析仪表17台项目编号:0712-244022403001招标范围:在线分析仪表17台招标机构:中国石化国际事业硬实力赢得现场关注 韫茂科技亮相慕尼黑上海光博会
【化工仪器网 展会报道】2024年3月20日,慕尼黑上海光博会在上海新博览中心顺利举行。本次展会展出面积超80000平方米,邀请了来自全球23个国家和地区的1160家展商共聚上海,吸引了国内外超9万名