类Sora模型到底懂不懂物理?字节完成系统性实验证明
Sora爆火以来,模明“视频生成模型到底懂不懂物理规律”受到热议,型到系统性实但业界一直未有研究证实。底懂近日,不懂字节跳动豆包大模型团队公布最新论文,物理完成研究历时8个月,字节围绕“视频生成模型距离世界模型有多远”首次在业界完成系统性实验并给出明确结论:视频生成模型可以记忆训练案例,验证但暂时还无法真正理解物理规律,模明做到“举一反三”。型到系统性实
图灵奖得主、底懂Meta首席AI科学家杨立昆点赞并转发了该研究,不懂表示“结论不令人意外,物理完成但很高兴终于有人做了这个尝试!字节”
自OpenAI发布Sora模型以来,验证很多视频生成模型都会强调其生成结果对物理规律的模明遵循。豆包大模型视觉团队相关小组,对视频生成模型究竟能否从视觉数据中“发现”并“理解”物理定律感到好奇,决定深入研究。
历时8个月,该团队完成了业界首个系统性的实验研究。团队通过专门开发的物理引擎合成了匀速直接运动、小球碰撞、抛物线运动等经典物理场景的运动视频,用于训练基于主流DiT架构的视频生成模型。然后,通过检验模型后续生成的视频在运动和碰撞方面是否符合力学定律,判断模型是否真正理解了物理规律,并具有“世界模型”的潜力。
实验中设计的不同运动场景
豆包大模型团队的实验发现,即使遵循“Scaling Law”增大模型参数规模和数据量,模型依然无法抽象出一般物理规则,做到真正“理解”。
以最简单的匀速直线运动为例,当模型学习了不同速度下小球保持匀速直线运动的训练数据后,给定初始几帧,要求模型生成小球在训练集速度区间内匀速直线运动的视频,随着模型参数和训练数据量的增加,生成的视频逐渐更符合物理规律。
然而,当要求模型生成未曾见过的速度区间(即超出训练数据范围)的运动视频时,模型突然不再遵循物理规律,并且无论如何增加模型参数或训练数据,生成的结果都没有显著改进。这表明,视频生成模型无法真正理解物理规律,也无法将这些规律泛化应用到全新的场景中。
通过进一步的实验分析,研究团队得出结论,“生成新视频时,模型主要依赖对训练案例的记忆和匹配。视频生成模型就像一个只会‘抄作业’的学生,一旦遇到从未见过的场景,如不同大小、速度的物体相互作用,就会‘犯迷糊’,生成结果与物理规则不符。”
不过,研究中也有一个好消息:如果训练视频中所有概念和物体都是模型已熟悉的,此时加大训练视频的复杂度,比如组合增加物体间的物理交互,通过加大训练数据,模型对物理规律的遵循将越来越好。这一结果可为视频生成模型继续提升表现提供启发。
据了解,本研究两位核心一作都非常年轻,一位是95后,一位是00后,在豆包大模型团队专注视觉领域的基础研究工作。作者们一直对世界模型感兴趣,在8个月的探索中,他们阅读了大量物理学研究文献,也尝试从游戏中获得研发灵感,历经多次失败后,最终一步步确定研究思路和实验方法。
-
文章
6
-
浏览
67
-
获赞
56616
热门推荐
-
陕西延安:专项检查中秋月饼市场
中国消费者报西安讯记者徐文智)中秋佳节临近,月饼等节令食品迎来销售旺季,为保证群众吃上安全放心的月饼,确保节日期间食品安全,9月7日上午,陕西省延安市市场监管局对宝塔区制作传统月饼糕点的小作坊和经营店揭秘:为什么说赵匡胤的梦想是“世界和平”?
自古以来,帝王难为,特别是开国之君,想要坐稳龙椅,往往需要大开杀戒,屠戮功臣,排除异己,以保江山。从刘邦到朱元璋,在登基初的非常时期都曾采用过非常手段。而宋朝开国皇帝赵匡胤却能屡屡用非常智慧取代非常手武则天乾陵为何立无字碑?千百年令世人费解
唐朝作为我国最为显赫朝代之一,有着太多太多精的故事,大唐盛世是中华民族悠久历史中最为辉煌的篇章。在唐朝更是出现中国第一个也是唯一一个女皇帝—武则天!武则天,名曌,跟其他女王不同,武则天是我国历史上唯一成吉思汗成就霸业的秘诀:误斩爱鹰悟道善于自制
成吉思汗能取得伟大成就,与他善于管理情绪,遇事冷静不冲动的性格息息相关,而他之所以善于制怒,则与一段传奇经历有关。网络配图 传说,有一次成吉思汗独自打猎,烈日当空之下,他在羊肠小道上走了很久,甚是口渴市场监管总局启动第十届“电梯安全宣传周”活动
中国消费者报讯根据2021年全国“质量月”活动安排,按照“安心乘梯守护行动”工作要求,9月13日至19日,市场监管总局启动第十届“电梯安全宣“早”“准”“快”—乌海机场精准预报11月11日降雪天气
中国民用航空网讯乌海机场:尚育琛报道)11月11日上午乌海机场迎来了今年冬季的第一场降雪,出现雨夹雪转雪天气,气象台提前发布预警信号传递天气信息,各部门按照职责开展降雪保障工作,顺利保障机场设施设备运王莽杀子求荣:四个儿子弄死三剩下一个被吓疯
王莽篡汉是中国历史上一个著名的小插曲,作为外戚,王莽步步为营,最终篡权成功,他必然是个狠角色。常言道“虎毒不食子”,但是王莽却狠出了天际,杀了女婿汉平帝也就算了,连自己的亲儿子也不放过:他四个儿子中,和田机场安全检查站开展“强三基、保安全、促发展”岗位技能唤醒培训
(中国民用航空网通讯员:韩睿)近日,和田机场安全检查站为了防止航班低位运行期间员工出现松劲心态,业务技能生疏等问题,结合实际,制定了业务技能唤醒培训计划推进表,从实际出发,分清主次,以班组为单位开展业维纳尔杜姆:不开心在巴黎的处境 荣幸做梅西队友
维纳尔杜姆:不开心在巴黎的处境 荣幸做梅西队友_时间www.ty42.com 日期:2021-10-12 08:01:00| 评论(已有306473条评论)鄂尔多斯机场配合自治区林草局完成2022年度辖区护林防火巡视工作
通讯员 王一兵 报道)近日,鄂尔多斯机场配合自治区林草局完成了2022年度辖区护林防火巡视工作,并收到执行任务的中国通用航空公司赠送的锦旗表示感谢。此次飞行任务由自治区林草局授权鄂尔多斯市林草局委托中阿克苏机场开展“119消防宣传日”主题活动
中国民用航空网通讯员张钰 张昕久讯:一年一度的消防日它来啦!阿克苏机场围绕今年的消防主题“抓消防安全、保高质量发展”开展了内容广泛、形式有趣的消防安全宣传活动。 随着冬季的桂林空管开展“学习二十大大·建功新时代”机关技能大赛
通讯员:齐玉蓉)为深化党的二十大精神学习贯彻落实,持续巩固党史学习教育成果, 11 月 11日,桂林空管站开展以“学习二十大建功新时代”为主题的 2022 年度机关技能大赛。此C罗轰国家队112球再刷纪录 出场超拉莫斯欧洲第1
C罗轰国家队112球再刷纪录 出场超拉莫斯欧洲第1_比赛www.ty42.com 日期:2021-10-10 08:31:00| 评论(已有306170条评论)提前29分钟落地,东航浙江在宁波顺利保障第9次人体器官运输
11月9日,mu5238航班提前29分钟降落在宁波栎社国际机场,携带造血干细胞的旅客第一个走下飞机,在东航浙江分公司地服人员的引导下从绿色通道迅速通过,出站时间仅用时14分钟。 9日当天15库车机场开展机场手册审核工作
为保证库车机场手册体系的有效运行,近日,库车机场按照机场集团视频会议要求组织安全管理人员、基层保障部门主管负责人)、手册管理员和业务骨干,通过现场审核的方式对各部门运行管理手册、岗位操作规范进行全