类Sora模型到底懂不懂物理?字节完成系统性实验证明
Sora爆火以来,模明“视频生成模型到底懂不懂物理规律”受到热议,型到系统性实但业界一直未有研究证实。底懂近日,不懂字节跳动豆包大模型团队公布最新论文,物理完成研究历时8个月,字节围绕“视频生成模型距离世界模型有多远”首次在业界完成系统性实验并给出明确结论:视频生成模型可以记忆训练案例,验证但暂时还无法真正理解物理规律,模明做到“举一反三”。型到系统性实
图灵奖得主、底懂Meta首席AI科学家杨立昆点赞并转发了该研究,不懂表示“结论不令人意外,物理完成但很高兴终于有人做了这个尝试!字节”
自OpenAI发布Sora模型以来,验证很多视频生成模型都会强调其生成结果对物理规律的模明遵循。豆包大模型视觉团队相关小组,对视频生成模型究竟能否从视觉数据中“发现”并“理解”物理定律感到好奇,决定深入研究。
历时8个月,该团队完成了业界首个系统性的实验研究。团队通过专门开发的物理引擎合成了匀速直接运动、小球碰撞、抛物线运动等经典物理场景的运动视频,用于训练基于主流DiT架构的视频生成模型。然后,通过检验模型后续生成的视频在运动和碰撞方面是否符合力学定律,判断模型是否真正理解了物理规律,并具有“世界模型”的潜力。
实验中设计的不同运动场景
豆包大模型团队的实验发现,即使遵循“Scaling Law”增大模型参数规模和数据量,模型依然无法抽象出一般物理规则,做到真正“理解”。
以最简单的匀速直线运动为例,当模型学习了不同速度下小球保持匀速直线运动的训练数据后,给定初始几帧,要求模型生成小球在训练集速度区间内匀速直线运动的视频,随着模型参数和训练数据量的增加,生成的视频逐渐更符合物理规律。
然而,当要求模型生成未曾见过的速度区间(即超出训练数据范围)的运动视频时,模型突然不再遵循物理规律,并且无论如何增加模型参数或训练数据,生成的结果都没有显著改进。这表明,视频生成模型无法真正理解物理规律,也无法将这些规律泛化应用到全新的场景中。
通过进一步的实验分析,研究团队得出结论,“生成新视频时,模型主要依赖对训练案例的记忆和匹配。视频生成模型就像一个只会‘抄作业’的学生,一旦遇到从未见过的场景,如不同大小、速度的物体相互作用,就会‘犯迷糊’,生成结果与物理规则不符。”
不过,研究中也有一个好消息:如果训练视频中所有概念和物体都是模型已熟悉的,此时加大训练视频的复杂度,比如组合增加物体间的物理交互,通过加大训练数据,模型对物理规律的遵循将越来越好。这一结果可为视频生成模型继续提升表现提供启发。
据了解,本研究两位核心一作都非常年轻,一位是95后,一位是00后,在豆包大模型团队专注视觉领域的基础研究工作。作者们一直对世界模型感兴趣,在8个月的探索中,他们阅读了大量物理学研究文献,也尝试从游戏中获得研发灵感,历经多次失败后,最终一步步确定研究思路和实验方法。
友链
外链
互链
Copyright © 2023 Powered by
六合彩图库源码【购买联系电报bc3979】AC彩票网站源码|六合彩源码|彩票搭建|新中原六合彩源码|【网站bc9797.com】六合彩论坛源码【联系飞机bc3979】
sitemap
-
文章
5
-
浏览
872
-
获赞
3577
热门推荐
-
Vans Old Skool Pro BMX 全新 Larry Edgar 签名鞋款上架
潮牌汇 / 潮流资讯 / Vans Old Skool Pro BMX 全新 Larry Edgar 签名鞋款上架2020年02月19日浏览:5531 日前,在刚刚结束叶檀:房价仍有下行空间建议买房者再等等
叶檀:房价仍有下行空间 建议买房者再等等2011年11月23日14:00 陈怡 手机看新闻在率先降价的大开发商中,竟是现金流充足的中海,这意味着大开发商在挤压较小规模的开发商,当小开发商顶不住时,又将秦灭周的时间是怎样的?秦灭周具体到西周还是东周?
在中国的古代,有着许许多多的朝代,历史十分的悠久,可以分为上下五千年了。那么在夏、商之后就是周朝,那么周朝持续了多少年的时间,周朝怎么建国,怎么覆灭的呢?周朝之后就是秦国,秦灭周的时间是怎样的呢?秦灭郭德纲演评剧,名符其实的教授
郭德纲又演评剧了,而且一排就是两出。我估计这个月的长安大戏院可能会比平时更热闹一点,当然,这一点首先来自于郭德纲个人的信心和自身的号召力。当下的80及90后们,恐怕很难理解评剧在上世纪五六十年代为何风护航开学季 确保放心餐
中国消费者报兰州讯冯潇记者徐文智)为保障学校师生饮食安全,近日,甘肃省兰州市七里河区市场监管局联合七里河区教育局开展2021年秋季学校“护航开学季、确保放心餐”专项整治行动。检王占阳:公务员热是一种体制性现象
公务员热本来就不是一种健康现象,本来就不该热起来,因为,公务员热的实质是公务员所得利益过多。公务员热理所应当降温,拐点应该到来,这才符合广大人民群众的根本利益和普遍利益。同时,也是中国分配制度改革,扩孙子兵法中三十六计之暗渡陈仓简介,它的出处是什么?
今天趣历史小编为大家带来了一篇关于三十六计之暗渡陈仓的文章,欢迎阅读哦~示之以动①,利其静而有主,“益动而巽②”。【注释】①示之以动:示,给人看。动,此指军事上的正面佯攻、佯动等迷惑敌方的军事行动。②既然燕国是战国七雄中最弱的,为何又说它是资历最老的?
经过春秋时期(公元前770年—公元前476年,一说公元前453年,另一说公元前403年)的旷日持久的争霸战争,周王朝境内的诸侯国数量大大减少,公元前453年,韩、赵、魏推翻智氏,以三家分晋的结果为标志Yeezy 篮球鞋双版本登陆,你准备好了么?
潮牌汇 / 潮流资讯 / Yeezy 篮球鞋双版本登陆,你准备好了么?2020年02月14日浏览:3921 此前,美乐淘潮牌汇便为大家带来了Yeezy 篮球鞋的相关发售小产权房屋遗留问题宜用市场化方法解决
先确权,再努力实现农村土地利益与城市土地利益的同权,为今后农村土地的合理使用和开发奠定了基础。但是也要看到,此前产权关系模糊混乱时期的遗留问题,并不会随之消失。国土资源部日前透露,农村集体土地的确权登战国时代的东周有多么弱?竟和战国七雄不是一个等级
西周末年,周幽王宠幸褒姒,幽王废掉正后申侯之女及太子宜臼,改立褒姒为后,改立褒姒之子为太子。宜臼逃奔申国,宜臼的母亲是申侯的女儿。申侯联合缯国和西方的犬戎进攻幽王。杀幽王于骊山之下,犬戎乘机掠走大量财“艾滋谣言”盛传源于公众常识匮乏
近日,有人在网络和手机短信中传播一条信息:食用艾滋病人滴过血的食物导致多人感染艾滋病。卫生部新闻办公室昨天回应称:这纯属谣言。16日,新疆自治区公安厅也通过官方新浪微博“平安天山”辟谣称,未发现新疆籍美潮 NOAH 2020 全新春夏配饰系列上架发售
潮牌汇 / 潮流资讯 / 美潮 NOAH 2020 全新春夏配饰系列上架发售2020年02月16日浏览:3858 自不久前的 2020 春夏系列型录中,我们看到了美潮为何战国时期的秦国不敢独自称帝?只因害怕齐国不答应
从太公望在营丘立国,“通工商之业,便鱼盐之利”,齐国便开始快速发展,到春秋时期,齐国已经成为了诸侯之中数一数二的强国,齐桓公更是将齐国带上了“春秋五霸”之首的宝座。进入战国,齐国因“田氏代齐”,很是低老百姓对李自成的期望很高,但为何当了皇帝的他就堕落了?
崇祯十七年,也就是顺治帝元年的三月十九日那天上午,天空晴朗,万里无云,天地之间似乎充满了吉祥。有个京城的百姓主动打开了朝阳门,让农民军进城。北京城像过节一样,家家户户在门上贴出黄贴,上面写着“永昌元年