类Sora模型到底懂不懂物理?字节完成系统性实验证明
Sora爆火以来,模明“视频生成模型到底懂不懂物理规律”受到热议,型到系统性实但业界一直未有研究证实。底懂近日,不懂字节跳动豆包大模型团队公布最新论文,物理完成研究历时8个月,字节围绕“视频生成模型距离世界模型有多远”首次在业界完成系统性实验并给出明确结论:视频生成模型可以记忆训练案例,验证但暂时还无法真正理解物理规律,模明做到“举一反三”。型到系统性实
图灵奖得主、底懂Meta首席AI科学家杨立昆点赞并转发了该研究,不懂表示“结论不令人意外,物理完成但很高兴终于有人做了这个尝试!字节”
自OpenAI发布Sora模型以来,验证很多视频生成模型都会强调其生成结果对物理规律的模明遵循。豆包大模型视觉团队相关小组,对视频生成模型究竟能否从视觉数据中“发现”并“理解”物理定律感到好奇,决定深入研究。
历时8个月,该团队完成了业界首个系统性的实验研究。团队通过专门开发的物理引擎合成了匀速直接运动、小球碰撞、抛物线运动等经典物理场景的运动视频,用于训练基于主流DiT架构的视频生成模型。然后,通过检验模型后续生成的视频在运动和碰撞方面是否符合力学定律,判断模型是否真正理解了物理规律,并具有“世界模型”的潜力。
实验中设计的不同运动场景
豆包大模型团队的实验发现,即使遵循“Scaling Law”增大模型参数规模和数据量,模型依然无法抽象出一般物理规则,做到真正“理解”。
以最简单的匀速直线运动为例,当模型学习了不同速度下小球保持匀速直线运动的训练数据后,给定初始几帧,要求模型生成小球在训练集速度区间内匀速直线运动的视频,随着模型参数和训练数据量的增加,生成的视频逐渐更符合物理规律。
然而,当要求模型生成未曾见过的速度区间(即超出训练数据范围)的运动视频时,模型突然不再遵循物理规律,并且无论如何增加模型参数或训练数据,生成的结果都没有显著改进。这表明,视频生成模型无法真正理解物理规律,也无法将这些规律泛化应用到全新的场景中。
通过进一步的实验分析,研究团队得出结论,“生成新视频时,模型主要依赖对训练案例的记忆和匹配。视频生成模型就像一个只会‘抄作业’的学生,一旦遇到从未见过的场景,如不同大小、速度的物体相互作用,就会‘犯迷糊’,生成结果与物理规则不符。”
不过,研究中也有一个好消息:如果训练视频中所有概念和物体都是模型已熟悉的,此时加大训练视频的复杂度,比如组合增加物体间的物理交互,通过加大训练数据,模型对物理规律的遵循将越来越好。这一结果可为视频生成模型继续提升表现提供启发。
据了解,本研究两位核心一作都非常年轻,一位是95后,一位是00后,在豆包大模型团队专注视觉领域的基础研究工作。作者们一直对世界模型感兴趣,在8个月的探索中,他们阅读了大量物理学研究文献,也尝试从游戏中获得研发灵感,历经多次失败后,最终一步步确定研究思路和实验方法。
-
文章
181
-
浏览
2172
-
获赞
2
热门推荐
-
曝巴萨债务已减少28.4% 仍有1.15亿欧转会费待付
曝巴萨债务已减少28.4% 仍有1.15亿欧转会费待付_欧元www.ty42.com 日期:2021-10-05 09:31:00| 评论(已有305427条评论)扶贫办:脱贫攻坚不会受到经济形势的影响
中新网5月10日电 国务院扶贫办主任刘永富今日指出,中国脱贫攻坚政策是经过认真研究的,已经考虑到经济转型,特别是经济下行压力加大的因素。不要把扶贫看成负担,它是经济社会发展的重要组成部分,脱贫攻坚不会公安部“打拐神器”来了:收到推送你该做什么
新华社北京5月21日电(记者朱基钗)今后,当你低头刷手机的时候,如果收到一条关于失踪儿童信息的弹窗,请注意:最近几个小时、距离你500公里范围内,有一名儿童被拐!这时你扫视四周,如果碰巧看到或者之前遇教育部:不降支援省份高考录取率
近日,多地调出高考招生计划支援中西部地区一事引发关注,部分家长担心由此会致使省内高校招生计划减少、高考录取率下降。教育部昨日表示,安排支援中西部地区招生协作计划,以不降低各支援省份的高考录取陕煤澄合百良公司综合队党支部:压实党员责任,筑牢安全基础
入冬以来,陕煤澄合百良公司综合队党支部针对秋冬季节性环境变化及对设备的影响特点,提早谋划分工,明确压实责任、严控风险、推动安全关口前移,堵塞各类安全漏洞,全力防范化解各类风险,消除安全隐患,严防事故发中国气象局:厄尔尼诺本月将结束,梅雨季节长江流域易发洪灾
5月9日,记者从中国气象局新闻通气会上了解到,持续了20个月的超强厄尔尼诺事件正处于快速衰减过程,预计将于5月结束。但是,由于大气对厄尔尼诺的响应一般具有滞后性,在6月至7月的梅雨季节,大气司法部官微借《欢乐颂》普法:遇到渣男该不该撕?
@中国普法:【《欢乐颂》法律知识大放送】近日,热播剧《欢乐颂》引发了网友和观众的热烈关注,除了高智商高学历的帅哥美女外,这部剧还涉及了不少法律知识,有些情节对我们的生活很有借鉴意义呢?来来来,跟着小编中国多项经济数据回稳 “结构”成“晴雨表”
中新社北京5月15日电 (记者 周锐)经历了3月份的明显回暖后,中国多个核心经济指标在4月份集体放缓增速,传统推动力丧失对增长的下拉与新经济对增长的推动之间的力量对比变化,成为中国经济当下最OVO x 其乐全新联乘鞋履系列发售,荧光色主打
潮牌汇 / 潮流资讯 / OVO x 其乐全新联乘鞋履系列发售,荧光色主打2020年02月25日浏览:3057 日前,由加拿大人气说唱歌手 Drake 主理的街头品牌O湖南落马高官靠喝酒升官 自诩一身酒气两袖清风
八项规定刹住了吃喝风。吃喝风为什么要刹?除了反对铺张浪费外,还有一层深意。饭局文化,古来有之。正所谓天下没有免费的午餐,三五好友一起聚餐,谓之饭;而为达到一定目的在一起吃饭,则谓之局了。长安街知事ID汪洋:加快推进农业结构调整
本报哈尔滨5月13日电 记者袁泉)国务院副总理汪洋近日在黑龙江省考察农业农村工作。他强调,新形势下我国农业主要矛盾已由总量不足转变为结构性矛盾,要认真贯彻党中央、国务院决策部署,切实把推进结男子冒充养生专家骗钱 三百元“神药”卖三千
冒充“养生专家”,以举办健康讲座为幌子,向“听课”的老年人赠送“礼品”取得信任后,便开始兜售价格昂贵的产品,骗取老年人的钱财。近日,增城警方抓获两名诈骗嫌疑人。4月初,家住增城区石球队陷入危机?克洛普怼记者:写你想写的,你低估了球迷的智慧
1月30日讯 利物浦主帅克洛普今天出席对阵切尔西的赛前新闻发布会,谈到了范迪克的未来。你宣布赛季末离任后,范迪克等人仅剩18个月合同,球队项目会不会短期内有危机?克洛普:“不,这完全正常。很明显,外界哈尔滨实现土地确权农村产权可公开流转交易
本报哈尔滨5月14日电记者郑少忠、方圆)晚饭时间,村民张义有一家老小围坐在一起,反复端详着红彤彤的土地确权证书,合计着未来的好日子,“18亩地名正言顺地归到自己名下。如今全屯的人都把心放到肚监狱系统首个孔子学堂揭牌,引导服刑人员重树正确道德信仰
5月7日上午,山东省鲁中监狱举行“全国监狱系统首家‘孔子学堂’——暨鲁中监狱‘孔子学堂’揭牌仪式”。 文内图均来自中国青年网齐鲁网消息,5月7日上午,山东省鲁中监狱举行“全国监狱系统首家‘孔