类Sora模型到底懂不懂物理?字节完成系统性实验证明
Sora爆火以来,模明“视频生成模型到底懂不懂物理规律”受到热议,型到系统性实但业界一直未有研究证实。底懂近日,不懂字节跳动豆包大模型团队公布最新论文,物理完成研究历时8个月,字节围绕“视频生成模型距离世界模型有多远”首次在业界完成系统性实验并给出明确结论:视频生成模型可以记忆训练案例,验证但暂时还无法真正理解物理规律,模明做到“举一反三”。型到系统性实
图灵奖得主、底懂Meta首席AI科学家杨立昆点赞并转发了该研究,不懂表示“结论不令人意外,物理完成但很高兴终于有人做了这个尝试!字节”
自OpenAI发布Sora模型以来,验证很多视频生成模型都会强调其生成结果对物理规律的模明遵循。豆包大模型视觉团队相关小组,对视频生成模型究竟能否从视觉数据中“发现”并“理解”物理定律感到好奇,决定深入研究。
历时8个月,该团队完成了业界首个系统性的实验研究。团队通过专门开发的物理引擎合成了匀速直接运动、小球碰撞、抛物线运动等经典物理场景的运动视频,用于训练基于主流DiT架构的视频生成模型。然后,通过检验模型后续生成的视频在运动和碰撞方面是否符合力学定律,判断模型是否真正理解了物理规律,并具有“世界模型”的潜力。
实验中设计的不同运动场景
豆包大模型团队的实验发现,即使遵循“Scaling Law”增大模型参数规模和数据量,模型依然无法抽象出一般物理规则,做到真正“理解”。
以最简单的匀速直线运动为例,当模型学习了不同速度下小球保持匀速直线运动的训练数据后,给定初始几帧,要求模型生成小球在训练集速度区间内匀速直线运动的视频,随着模型参数和训练数据量的增加,生成的视频逐渐更符合物理规律。
然而,当要求模型生成未曾见过的速度区间(即超出训练数据范围)的运动视频时,模型突然不再遵循物理规律,并且无论如何增加模型参数或训练数据,生成的结果都没有显著改进。这表明,视频生成模型无法真正理解物理规律,也无法将这些规律泛化应用到全新的场景中。
通过进一步的实验分析,研究团队得出结论,“生成新视频时,模型主要依赖对训练案例的记忆和匹配。视频生成模型就像一个只会‘抄作业’的学生,一旦遇到从未见过的场景,如不同大小、速度的物体相互作用,就会‘犯迷糊’,生成结果与物理规则不符。”
不过,研究中也有一个好消息:如果训练视频中所有概念和物体都是模型已熟悉的,此时加大训练视频的复杂度,比如组合增加物体间的物理交互,通过加大训练数据,模型对物理规律的遵循将越来越好。这一结果可为视频生成模型继续提升表现提供启发。
据了解,本研究两位核心一作都非常年轻,一位是95后,一位是00后,在豆包大模型团队专注视觉领域的基础研究工作。作者们一直对世界模型感兴趣,在8个月的探索中,他们阅读了大量物理学研究文献,也尝试从游戏中获得研发灵感,历经多次失败后,最终一步步确定研究思路和实验方法。
-
文章
35
-
浏览
235
-
获赞
4986
热门推荐
-
辽宁:省市区12315部门三级联动 优化市场服务环境
中国消费者报沈阳讯(记者王文郁)9月9日,《中国消费者报》记者从辽宁省市场监管局了解到,辽宁省市场监管事务服务中心投诉举报中心近日会同沈阳市市场监管投诉举报中心、浑南区市场监管局召开专题座谈会议,就O喀什机场协同南航喀什基地召开2023年度夏秋换季协调会
通讯员:张雪妍)3月26日,为进一步做好夏秋换季工作,切实做好夏秋航季航班保障工作,喀什机场协同南航喀什基地召开2023年度夏秋换季协调会。机场领导、南航喀什基地负责人、各保障部门主管、助理参加了本次阿勒泰雪都机场完成登机口、值机柜台升级改造有效提升服务水平
为进一步提升现场服务设施的视觉效果及旅客服务体验,近日,阿勒泰雪都机场完成登机口、柜台改造及服务优化提升。 阿勒泰雪都机场从旅客体验角度出发,突出阿勒泰雪都机场主题风格,提升了整体环境更加美观,海南空管分局顺利完成博鳌亚洲论坛2023年年会空管保障任务
通讯员:彭时渊 赵凌芳 唐茜)博鳌亚洲论坛2023年年会于3月28日至31日在博鳌举行。海南空管分局始终坚持安全第一的工作方针,以“统一领导、各司其职、加强协调、确保安全”为原英媒:若林加德不续约将在冬窗被卖 纽卡西汉姆有意
英媒:若林加德不续约将在冬窗被卖 纽卡西汉姆有意_曼联www.ty42.com 日期:2021-10-12 08:01:00| 评论(已有306472条评论)塔什库尔干机场召开机坪运行安全形势分析会
通讯员 曾丹)为认真贯彻落机场集团运行安全工作会议精神,切实做好机坪安全监管工作,3月31日,塔什库尔干机场组织召开3月份机坪运行安全形势分析会,机场领导与各机坪作业部门负责人参加会议。会上机场保障部民航湖北空管分局圆满完成武汉天河机场改扩建工程空管工程详勘工作
通讯员:江政隆;)2023年3月21日,民航湖北空管分局圆满完成武汉天河机场改扩建工程空管工程详勘工作,此次详勘工作为总计27个勘测点的钻探工程,于2月24日正式开始现场作业,前后历时25天。重庆空管分局塔台管制室党支部开展主题党日活动
为铭记革命历史,弘扬爱国精神,2023年3月14日,重庆空管分局管制运行部塔台管制室党支部组织开展了以“传承红色革命基因 弘扬爱国奋斗精神”为主题的主题党日活动,支部党佳节至保食安 浙江宁波开展月饼流通领域检查
中国消费者报杭州讯记者郑铁峰)随着中秋佳节的脚步临近,节日氛围逐渐浓厚,超市、酒店等也在如火如荼地展开各式月饼的销售活动。如今的月饼口味多样、造型各异,创新形式的月饼层出不穷,例如冰皮月饼、流心月饼、诸葛亮为何没有投靠曹操 有段经历让他刻骨铭心
诸葛亮为何选择了寄寓荆州的刘备而不去依附已占据中原的曹操,这是很多人都关心的一个话题。大致上的看法有这么几种,一是认为诸葛亮的政治理念与曹操差别太太,二是曹操手下谋士如云,诸葛亮去了也发挥不了什么作用历史上死的最难堪的国君之一 竟被活活饿死!
他是春秋五霸之一,是春秋前期政治舞台上的一颗明星,在时代呼唤霸主的时候,他借助于先辈大臣40年的苦心经营,再加上他自己的南征北战到处扬威树德,充当了诸侯国的真正领袖,文治武功盛极一时。然而就是这样一位今日起,川航双流机场国内航班转至T2运行
今日4月3日)零时起,由于双流机场T1航站楼提质改造,川航在成都双流的国内进出港航班搬迁至T2运行。待改造完毕后,川航将回归T1运行。 今日早间6:05,川航在T2的首个出港航班3U8933双流-青GROUNDY 2020 春夏系列 Lookbook 释出,无性别设计
潮牌汇 / 潮流资讯 / GROUNDY 2020 春夏系列 Lookbook 释出,无性别设计2020年02月25日浏览:2871 山本耀司的子品牌 GROUNDY继歼灭唐军数十万,军神薛仁贵败于他手,大唐惧他三十年
唐朝是中国历史上最繁盛的一个时期,无论政治、经济、文化都发展到了一个最高峰,尤其是唐朝初年,真可谓是英雄辈出的时期,经历了长期的战乱之后,涌现出了无数的英雄,为大唐基业的开创奠定了坚实的基础,比如秦琼湛江空管站召开2023年第一季度纪委全委会
3月30日,湛江空管站纪委召开了2023年第一季度全委会,会议主要任务是传达学习中央和上级文件精神,总结纪检工作中的经验和不足,谋划本年度纪委工作计划和重点任务。会议强调了加强基层党组织建设的重要性。