类Sora模型到底懂不懂物理?字节完成系统性实验证明
Sora爆火以来,模明“视频生成模型到底懂不懂物理规律”受到热议,型到系统性实但业界一直未有研究证实。底懂近日,不懂字节跳动豆包大模型团队公布最新论文,物理完成研究历时8个月,字节围绕“视频生成模型距离世界模型有多远”首次在业界完成系统性实验并给出明确结论:视频生成模型可以记忆训练案例,验证但暂时还无法真正理解物理规律,模明做到“举一反三”。型到系统性实
图灵奖得主、底懂Meta首席AI科学家杨立昆点赞并转发了该研究,不懂表示“结论不令人意外,物理完成但很高兴终于有人做了这个尝试!字节”
自OpenAI发布Sora模型以来,验证很多视频生成模型都会强调其生成结果对物理规律的模明遵循。豆包大模型视觉团队相关小组,对视频生成模型究竟能否从视觉数据中“发现”并“理解”物理定律感到好奇,决定深入研究。
历时8个月,该团队完成了业界首个系统性的实验研究。团队通过专门开发的物理引擎合成了匀速直接运动、小球碰撞、抛物线运动等经典物理场景的运动视频,用于训练基于主流DiT架构的视频生成模型。然后,通过检验模型后续生成的视频在运动和碰撞方面是否符合力学定律,判断模型是否真正理解了物理规律,并具有“世界模型”的潜力。
实验中设计的不同运动场景
豆包大模型团队的实验发现,即使遵循“Scaling Law”增大模型参数规模和数据量,模型依然无法抽象出一般物理规则,做到真正“理解”。
以最简单的匀速直线运动为例,当模型学习了不同速度下小球保持匀速直线运动的训练数据后,给定初始几帧,要求模型生成小球在训练集速度区间内匀速直线运动的视频,随着模型参数和训练数据量的增加,生成的视频逐渐更符合物理规律。
然而,当要求模型生成未曾见过的速度区间(即超出训练数据范围)的运动视频时,模型突然不再遵循物理规律,并且无论如何增加模型参数或训练数据,生成的结果都没有显著改进。这表明,视频生成模型无法真正理解物理规律,也无法将这些规律泛化应用到全新的场景中。
通过进一步的实验分析,研究团队得出结论,“生成新视频时,模型主要依赖对训练案例的记忆和匹配。视频生成模型就像一个只会‘抄作业’的学生,一旦遇到从未见过的场景,如不同大小、速度的物体相互作用,就会‘犯迷糊’,生成结果与物理规则不符。”
不过,研究中也有一个好消息:如果训练视频中所有概念和物体都是模型已熟悉的,此时加大训练视频的复杂度,比如组合增加物体间的物理交互,通过加大训练数据,模型对物理规律的遵循将越来越好。这一结果可为视频生成模型继续提升表现提供启发。
据了解,本研究两位核心一作都非常年轻,一位是95后,一位是00后,在豆包大模型团队专注视觉领域的基础研究工作。作者们一直对世界模型感兴趣,在8个月的探索中,他们阅读了大量物理学研究文献,也尝试从游戏中获得研发灵感,历经多次失败后,最终一步步确定研究思路和实验方法。
友链
外链
互链
Copyright © 2023 Powered by
六合彩图库源码【购买联系电报bc3979】AC彩票网站源码|六合彩源码|彩票搭建|新中原六合彩源码|【网站bc9797.com】六合彩论坛源码【联系飞机bc3979】
sitemap
-
文章
72
-
浏览
28271
-
获赞
11
热门推荐
-
高伦雅芙有用吗(高伦雅芙订购电话)
高伦雅芙有用吗(高伦雅芙订购电话)来源:时尚服装网阅读:1342proactive高伦雅芙使用方法很管用!眼药水也可以用来去痘,另外就是用完美芦荟胶,也能消痘,效果不错。还有就是Proactive,高民间借贷仅有“制度性合法”还不够
央行负责人称,民间借贷是正规金融有益和必要的补充,具有制度层面的合法性。只要不违反法律的强制性规定,民间借贷关系都受法律保护。央行负责人援引最高法的规定称,民间借贷最高不得超过银行同类贷款利率的4倍。为何刘备不重要诸葛亮?难道刘备三顾茅庐只为了“隆中对”吗?
面对东汉末年群雄割据的局面,诸葛亮像其他英豪一样,希望能找到一位能施展自己才华的明主。他知道自己的能力,因此要找的那位主公,应该是能听取的他计策,以实现自己心中的宏伟蓝图。在刘备三顾茅庐显示出其求贤若邻里公约,暖化人际冷漠的烛光
日前,由杭州西溪蝶园、魅力之城、钱江湾花园3个小区5500户业主共同讨论总结的《邻里公约》正式发布。内容包括了乐于参加公共活动、邻居见面主动问好、关怀和帮助独居老人、邻居长时间不在家帮助照看等19条约中粮各上市公司2016年4月18日-4月22日收盘情况
中粮集团旗下各上市公司2016年4月18日-4月22日收盘情况如下:4月18日4月19日4月20日4月21日4月22日中粮控股香港)06062.522.682.682.912.78中国食品香港)050玉玺是什么时候作为皇权的象征的?这之前代替玉玺的是什么?
在历史上,我们都知道每一个皇帝必须得到玉玺才算是名正言顺。这个玉玺便是被秦始皇铸造的一个权力的象征,代表的是天意。那么,在玉玺之前又是什么代表最高权力呢?下面趣历史小编就为大家带来详细的介绍,一起来看与曹操、刘备同一时期的孙权,为何在他们去世后不能一统三国?
在东汉末年三国争霸,每个国家都是雄踞一方的霸主,心中雄途伟业已经展开一半,谁都想将全国统一,成就王朝伟业。而这三位君主我们都是十分熟知,对于他们经历的战役和手下的将领都非常津津乐道,吴国的君主孙权也是董卓是怎么只用数千兵马,就控制了拥有数万兵马的洛阳?
汉末朝政崩坏,各种内忧外患爆发,各种政权明争暗抢。然而,最后是董卓领凉州军入洛阳,独揽了朝廷大权。当时董卓入京的时候,所带的兵马不过三千,但是京城中的禁军却有数万兵马,这董卓是如何夺得朝廷大权的呢?小利物浦本赛季已吃到5张红牌,全英超最多
2月5日讯 英超第23轮焦点战,利物浦客战阿森纳,比赛第87分钟,科纳特两黄变一红,被罚下场。据统计,利物浦本赛季共吃到了5张红牌,是英超所有球队中最多的。科纳特第一黄↓科纳特第二黄↓标签:利物浦阿森关于女人的世界之最 女人的世界作文
公认世界最美的女人1、玛丽莲·梦露是全球公认最美的女孩之一,她以招牌式的笑容和充满诱惑力的肢体语言塑造了一个又一个性感形象。她的颜值和性感形象让她享誉全球,成为每个男人幻想中的异性。2、奥黛丽.赫本是强生22次召回产品缘何均与中国无关?
据《法制晚报》报道,婴儿洗发水“疑似含毒”,并被指在华实行“双重标准”,这让本来就问题不断的强生公司再次站到风口浪尖上。据统计,自2009年9月以来,这家世界500强企业、全球最大医药保健公司产品召回医院莫抢夺“第一口奶”
据新华社报道,不得促销母乳代用品、禁止母乳代用品广告、医疗机构不得代售……为促进母乳喂养,保护母亲和婴儿身心健康,卫生部起草了《母乳代用品管理办法征求意见稿)》。母乳代用品是指以6个月以内婴儿为对象,《蜘蛛侠4》官宣定档2026年7月 《尚气》导演执导
索尼影业官宣《蜘蛛侠4》电影将于2026年7月24日上映,和外界预测一致,将由《尚气》导演Destin Daniel Cretton执导。Cretton在离开《复仇者联盟5》电影项目后,由罗素兄弟接手丁原为什么被自己的义子吕布杀害?原来二人之间积怨已久
在正史中,并没有属于丁原个人的传记,他的故事散落在与他命运息息相关的吕布、董卓等人的篇目中。这就让丁原的历史事迹,显得尤为神秘。如果有人说,这个丁原,不过是一个早死之人,在三国时期,像他这样还为干出什淘汰白炽灯需做“加减法”
“天不生灯具,万古如长夜”。陪伴人们走过100多年漫漫长夜的白炽灯,正式进入倒计时。11月4日上午,国家发改委发布淘汰白炽灯路线图,决定按功率大小分五个阶段逐步禁止进口和销售普通照明白炽灯,明年10月