类Sora模型到底懂不懂物理?字节完成系统性实验证明
Sora爆火以来,模明“视频生成模型到底懂不懂物理规律”受到热议,型到系统性实但业界一直未有研究证实。底懂近日,不懂字节跳动豆包大模型团队公布最新论文,物理完成研究历时8个月,字节围绕“视频生成模型距离世界模型有多远”首次在业界完成系统性实验并给出明确结论:视频生成模型可以记忆训练案例,验证但暂时还无法真正理解物理规律,模明做到“举一反三”。型到系统性实
图灵奖得主、底懂Meta首席AI科学家杨立昆点赞并转发了该研究,不懂表示“结论不令人意外,物理完成但很高兴终于有人做了这个尝试!字节”
自OpenAI发布Sora模型以来,验证很多视频生成模型都会强调其生成结果对物理规律的模明遵循。豆包大模型视觉团队相关小组,对视频生成模型究竟能否从视觉数据中“发现”并“理解”物理定律感到好奇,决定深入研究。
历时8个月,该团队完成了业界首个系统性的实验研究。团队通过专门开发的物理引擎合成了匀速直接运动、小球碰撞、抛物线运动等经典物理场景的运动视频,用于训练基于主流DiT架构的视频生成模型。然后,通过检验模型后续生成的视频在运动和碰撞方面是否符合力学定律,判断模型是否真正理解了物理规律,并具有“世界模型”的潜力。
实验中设计的不同运动场景
豆包大模型团队的实验发现,即使遵循“Scaling Law”增大模型参数规模和数据量,模型依然无法抽象出一般物理规则,做到真正“理解”。
以最简单的匀速直线运动为例,当模型学习了不同速度下小球保持匀速直线运动的训练数据后,给定初始几帧,要求模型生成小球在训练集速度区间内匀速直线运动的视频,随着模型参数和训练数据量的增加,生成的视频逐渐更符合物理规律。
然而,当要求模型生成未曾见过的速度区间(即超出训练数据范围)的运动视频时,模型突然不再遵循物理规律,并且无论如何增加模型参数或训练数据,生成的结果都没有显著改进。这表明,视频生成模型无法真正理解物理规律,也无法将这些规律泛化应用到全新的场景中。
通过进一步的实验分析,研究团队得出结论,“生成新视频时,模型主要依赖对训练案例的记忆和匹配。视频生成模型就像一个只会‘抄作业’的学生,一旦遇到从未见过的场景,如不同大小、速度的物体相互作用,就会‘犯迷糊’,生成结果与物理规则不符。”
不过,研究中也有一个好消息:如果训练视频中所有概念和物体都是模型已熟悉的,此时加大训练视频的复杂度,比如组合增加物体间的物理交互,通过加大训练数据,模型对物理规律的遵循将越来越好。这一结果可为视频生成模型继续提升表现提供启发。
据了解,本研究两位核心一作都非常年轻,一位是95后,一位是00后,在豆包大模型团队专注视觉领域的基础研究工作。作者们一直对世界模型感兴趣,在8个月的探索中,他们阅读了大量物理学研究文献,也尝试从游戏中获得研发灵感,历经多次失败后,最终一步步确定研究思路和实验方法。
-
文章
1224
-
浏览
643
-
获赞
4624
热门推荐
-
lancyfrom25服装旗舰店(lanz服装)
lancyfrom25服装旗舰店(lanz服装)来源:时尚服装网阅读:2233郎姿丽女装是品牌吗朗姿女装是二线品牌,属于中端档次。朗姿女装品牌主要的各种服饰以高雅的职业女装及富有时代韵味的精美时装为主消化内科联合临床营养科开展“炎症性肠病病人饮食健康教育”宣传
为了使炎症性肠病病人合理饮食,促进疾病的恢复,消化内科二病房医护一体联合临床营养科于5月30日15:00,开展了“炎症性肠病病人饮食健康教育”活动,30余名在院患者和家属以及炎症性肠病的病友参加了此次西安市新城区 坚决打赢疫情防控阻击战
中国消费者报西安讯钱斯航 记者徐文智)8月24日,陕西省西安市新城区市场监管局扎实落实落细重点场所、重点环节、重点人群疫情防控各项措施,对疫情防控漏洞再排查、防控重点再加固、防控要求再落实,保障辖区餐科技巨头疯狂收购AI公司,过去五年苹果排名第一!
3月26日消息,据外媒报道,在过去的五年中,苹果公司在收购人工智能公司数量上,在行业内排名第一。通过收购招揽AI人才一直是科技公司的常用手段,据CB Insights此前发布的报告显示,近十年期间,美霍伊伦数据:生日夜连续4场破门,预期进球0.14,获评7.5分
2月5日讯 英超第23轮,曼联3-0击败西汉姆,迎来21岁生日的霍伊伦连续4场破门,他出战88分钟,赛后获评7.5分。附霍伊伦本场数据:射门:2次射正:1次尝试过人:2次成功1次丢失球权:11次越位:穆帅:快颁给我最守规矩主帅奖 不卖德赫亚去皇马
2月11日报道:在很多人的印象中,穆里尼奥是一个争议人物,他经常抱怨赛程、怒喷裁判、和对手打嘴仗……不过,如今的穆帅渐渐丢掉了昔日的轻狂和浮躁,他正越来越成熟。在接受采访时,穆帅直言自己配得上本赛季英她他趣,她他趣味约聊
她他趣,她他趣味约聊来源:时尚服装网阅读:649...BROWN(未毕)这个牌子是轻奢品牌,她们家的性价比怎么样?1、这个牌子的包包质量不错,属于轻奢,款式也很受欢迎,做工精致,值得自己入手。2、vi《Victory Heat Rally》10月登陆Steam 复古风赛车
Skydevilpalm开发的一款复古风赛车新游《Victory Heat Rally》已经上架Steam,预定10月3日正式推出,本作暂不支持中文。《Victory Heat Rally》:Stea《星球大战9:天行者崛起》续集电影的编剧又走了
《星球大战9:天行者崛起》电影续集失去了自己的编剧Steven Knight。这部续集由莎梅·奥贝德-奇诺伊Sharmeen Obaid-Chinoy)执导,《星战》新三部曲电影女主黛茜·雷德利主演。曼城新高塔有个舞蹈家女友 游艇上幸福环绕睁不开眼
《太阳报》向球迷介绍了曼城准新援拉波尔特的性感女友,她叫萨拉,是一名西班牙舞蹈家。英媒和西媒称拉波尔特即将加盟曼城,他的性感女友萨拉-波特略也会和他一起登陆英超,球迷又有眼福了。《太阳报》称要成为一名AI商业化开启万亿赛道 十年一剑百度上演王者归来
2017年是人工智能石破天惊的一年。这一年5月27日,人工智能围棋程序AlphaGo战胜人类世界当时排名第一的棋手柯洁,颠覆了大众对人工智能的认识,也让全球看到人工智能无限“可能性”。2017年也是人澳大利亚维多利亚州医疗代表团来我院访问
5月16日上午11:30,澳大利亚维多利亚州国际卫生主管Linda Critine、墨尔本大学中国项目院长Doris Young等一行4人来院访问,双方就各自院校基本情况、科研优势、临床重点学科等方面carven和之禾哪个高档(之禾什么品牌)
carven和之禾哪个高档(之禾什么品牌)来源:时尚服装网阅读:3091谁是凶手沈雨穿的风衣牌子?1、谁是凶手风衣品牌是Dior。谁是凶手,剧情越看越上头,全员演技在线,但最吸引我的还是颖宝的穿搭,知杂技?丹麦球迷端啤酒山走上看台 中间还插着热狗
杂技?丹麦球迷端啤酒山走上看台 中间还插着热狗_战皆负www.ty42.com 日期:2021-06-25 09:31:00| 评论(已有286653条评论)为了开发《塞尔达传说:王国之泪》 任天堂创建了一个内部社交平台
在最近举行的日本计算机娱乐开发大会上,《塞尔达传说:王国之泪》的总监藤林秀麿和程序设计师广濑健一深入探讨了该作的开发过程,该团队付出了相当大的努力来帮助更好地简化开发人员的工作并改善他们之间的沟通,他