类Sora模型到底懂不懂物理?字节完成系统性实验证明
Sora爆火以来,模明“视频生成模型到底懂不懂物理规律”受到热议,型到系统性实但业界一直未有研究证实。底懂近日,不懂字节跳动豆包大模型团队公布最新论文,物理完成研究历时8个月,字节围绕“视频生成模型距离世界模型有多远”首次在业界完成系统性实验并给出明确结论:视频生成模型可以记忆训练案例,验证但暂时还无法真正理解物理规律,模明做到“举一反三”。型到系统性实
图灵奖得主、底懂Meta首席AI科学家杨立昆点赞并转发了该研究,不懂表示“结论不令人意外,物理完成但很高兴终于有人做了这个尝试!字节”
自OpenAI发布Sora模型以来,验证很多视频生成模型都会强调其生成结果对物理规律的模明遵循。豆包大模型视觉团队相关小组,对视频生成模型究竟能否从视觉数据中“发现”并“理解”物理定律感到好奇,决定深入研究。
历时8个月,该团队完成了业界首个系统性的实验研究。团队通过专门开发的物理引擎合成了匀速直接运动、小球碰撞、抛物线运动等经典物理场景的运动视频,用于训练基于主流DiT架构的视频生成模型。然后,通过检验模型后续生成的视频在运动和碰撞方面是否符合力学定律,判断模型是否真正理解了物理规律,并具有“世界模型”的潜力。
实验中设计的不同运动场景
豆包大模型团队的实验发现,即使遵循“Scaling Law”增大模型参数规模和数据量,模型依然无法抽象出一般物理规则,做到真正“理解”。
以最简单的匀速直线运动为例,当模型学习了不同速度下小球保持匀速直线运动的训练数据后,给定初始几帧,要求模型生成小球在训练集速度区间内匀速直线运动的视频,随着模型参数和训练数据量的增加,生成的视频逐渐更符合物理规律。
然而,当要求模型生成未曾见过的速度区间(即超出训练数据范围)的运动视频时,模型突然不再遵循物理规律,并且无论如何增加模型参数或训练数据,生成的结果都没有显著改进。这表明,视频生成模型无法真正理解物理规律,也无法将这些规律泛化应用到全新的场景中。
通过进一步的实验分析,研究团队得出结论,“生成新视频时,模型主要依赖对训练案例的记忆和匹配。视频生成模型就像一个只会‘抄作业’的学生,一旦遇到从未见过的场景,如不同大小、速度的物体相互作用,就会‘犯迷糊’,生成结果与物理规则不符。”
不过,研究中也有一个好消息:如果训练视频中所有概念和物体都是模型已熟悉的,此时加大训练视频的复杂度,比如组合增加物体间的物理交互,通过加大训练数据,模型对物理规律的遵循将越来越好。这一结果可为视频生成模型继续提升表现提供启发。
据了解,本研究两位核心一作都非常年轻,一位是95后,一位是00后,在豆包大模型团队专注视觉领域的基础研究工作。作者们一直对世界模型感兴趣,在8个月的探索中,他们阅读了大量物理学研究文献,也尝试从游戏中获得研发灵感,历经多次失败后,最终一步步确定研究思路和实验方法。
友链
外链
互链
Copyright © 2023 Powered by
六合彩图库源码【购买联系电报bc3979】AC彩票网站源码|六合彩源码|彩票搭建|新中原六合彩源码|【网站bc9797.com】六合彩论坛源码【联系飞机bc3979】
sitemap
-
文章
7435
-
浏览
37388
-
获赞
3335
热门推荐
-
巴西前瞻:力争世预赛9连胜 内马尔欲比肩梅西贝利
巴西前瞻:力争世预赛9连胜 内马尔欲比肩梅西贝利_比赛www.ty42.com 日期:2021-10-07 12:31:00| 评论(已有305747条评论)“瓷”心“瓷”景,与女神相约
即便正是春天的最好时候,也无法阻拦对初夏的向往。为帮助女职工舒缓压力,不断的陶冶女职工的思想情操,培养和传播健康、乐观、积极的正能量。因广州疫情反复,中南空管局技术保障中心女职工活动于5月23阿克苏机场开展驾驶员安全教育
中国民用航空网通讯员侯满文:为确保阿克苏机场夏季航班安全运行,进一步提高特种车辆驾驶员的安全意识,阿克苏机场机坪运行部开展了特种车辆驾驶员安全教育和培训。警示教育员工,牢记“安全第一,预防揭秘一世英明的唐宣宗晚年犯的两个致命错误
唐宣宗这位被史家誉为“明察沉断,用法无私,从谏如流,重惜官赏,恭谨节俭,惠爱民物。”的“小太宗”,却在晚期的宫庭生活与册立储君的问题上留下了人生最大的遗憾。在宫庭生活方面,为了长生与纵欲,不惜大量服食李铁:全队上下出战欲望强烈 相信表现超越前两场
李铁:全队上下出战欲望强烈 相信表现超越前两场_比赛www.ty42.com 日期:2021-10-06 23:31:00| 评论(已有305678条评论)西北空管局天通公司营业服务室党支部与机关离退部党支部开展结对共建活动
为进一步加强机关、基层党支部互融共建,促进党建优势互补,切实加强支部建设,用党的建设引领空管事业高质量发展。5月24日,西北空管局天通公司营业服务室党支部与机关离退部党支部开展结对共建活动。活动中,首呼伦贝尔空管站气象台观测室开展雷达资料分析与应用培训
观测员:冯怡)为进一步夯实气象观测员的基本功底,提高夏季雷雨期间气象保障的能力,气象台观测室于5月31号开展了雷达资料分析与应用培训工作。多普勒天气雷达是短时临近天气预报非常重要的工具!气象观测、预报莎车机场全面落实助残良好风尚
通讯员:汪阳)每年五月的第三个星期日为全国助残日,今年的5月16日是第31个全国助残日,莎车机场秉持着“真情服务”的理念,把对特殊旅客的关爱体现在每一个服务细节上,用自己的实际壕!德转:纽卡新老板能买两千多个姆巴佩或哈兰德
壕!德转:纽卡新老板能买两千多个姆巴佩或哈兰德_英超www.ty42.com 日期:2021-10-09 11:01:00| 评论(已有306057条评论)河北空管分局工程建设指挥部召开会议部署近期工作
通讯员 吕岩)5月27日,河北空管分局工程建设指挥部召开会议,布置开展石家庄机场空管改扩建工程行业验收整改情况工作,宣贯甚高频通信系统扩容工程安全生产专项治理行动实施方案,研究分局2022年建设项李君羡是谁?李君羡和武媚娘到底是什么关系?
李君羡是一位唐朝的将领,在唐朝建立之前,和唐朝建立之后,甚至到李世民时期都立国战功。但是李君羡最后却被李世民因为一句谣言所杀,而且谣言似乎还和女皇武媚娘有关。那么李君羡的生平是怎么样的呢,武媚娘和李君甘肃空管分局气象台组织5月安全检查
为保障一线运行安全,认真履行力戒形式主义,崇尚三个敬畏,严查干部履职,狠抓规章执行专项工作,5月31日上午,甘肃空管分局气象台组织质量安全员及相关管理人员对气象台进行了安全运行检查工作。在安全检查前,大悦城地产斩获中国商业地产行业发展论坛多项大奖
3月16-18日,中国商业地产行业发展论坛2016第十三届)年会暨“天府之夜”颁奖盛典在成都召开。大悦城地产荣获“中国最具价值商业地产开发商”奖项。本次喀什机场空管业务部开展“5.15国际航空情报日”系列活动
通讯员 康继宏)2022年5月15日——国际民航组织第69个国际航空情报日。为了进一步提升航空情报服务质量,夯实“三基建设”,落实“六个起来西南空管局积极配合做好京广大通道空域调整方案实施工作
中国民用航空网讯西南空管局冷静) 5月18日晚,民航西南地区管理局党委书记罗晓、副局长徐东毅,民航四川监管局局长潘学军,民航西南空管局局长何天剑、副局长雷贵生在西南空管局运管中心,对西南地区京广大通道