类Sora模型到底懂不懂物理?字节完成系统性实验证明
Sora爆火以来,模明“视频生成模型到底懂不懂物理规律”受到热议,型到系统性实但业界一直未有研究证实。底懂近日,不懂字节跳动豆包大模型团队公布最新论文,物理完成研究历时8个月,字节围绕“视频生成模型距离世界模型有多远”首次在业界完成系统性实验并给出明确结论:视频生成模型可以记忆训练案例,验证但暂时还无法真正理解物理规律,模明做到“举一反三”。型到系统性实
图灵奖得主、底懂Meta首席AI科学家杨立昆点赞并转发了该研究,不懂表示“结论不令人意外,物理完成但很高兴终于有人做了这个尝试!字节”
自OpenAI发布Sora模型以来,验证很多视频生成模型都会强调其生成结果对物理规律的模明遵循。豆包大模型视觉团队相关小组,对视频生成模型究竟能否从视觉数据中“发现”并“理解”物理定律感到好奇,决定深入研究。
历时8个月,该团队完成了业界首个系统性的实验研究。团队通过专门开发的物理引擎合成了匀速直接运动、小球碰撞、抛物线运动等经典物理场景的运动视频,用于训练基于主流DiT架构的视频生成模型。然后,通过检验模型后续生成的视频在运动和碰撞方面是否符合力学定律,判断模型是否真正理解了物理规律,并具有“世界模型”的潜力。
实验中设计的不同运动场景
豆包大模型团队的实验发现,即使遵循“Scaling Law”增大模型参数规模和数据量,模型依然无法抽象出一般物理规则,做到真正“理解”。
以最简单的匀速直线运动为例,当模型学习了不同速度下小球保持匀速直线运动的训练数据后,给定初始几帧,要求模型生成小球在训练集速度区间内匀速直线运动的视频,随着模型参数和训练数据量的增加,生成的视频逐渐更符合物理规律。
然而,当要求模型生成未曾见过的速度区间(即超出训练数据范围)的运动视频时,模型突然不再遵循物理规律,并且无论如何增加模型参数或训练数据,生成的结果都没有显著改进。这表明,视频生成模型无法真正理解物理规律,也无法将这些规律泛化应用到全新的场景中。
通过进一步的实验分析,研究团队得出结论,“生成新视频时,模型主要依赖对训练案例的记忆和匹配。视频生成模型就像一个只会‘抄作业’的学生,一旦遇到从未见过的场景,如不同大小、速度的物体相互作用,就会‘犯迷糊’,生成结果与物理规则不符。”
不过,研究中也有一个好消息:如果训练视频中所有概念和物体都是模型已熟悉的,此时加大训练视频的复杂度,比如组合增加物体间的物理交互,通过加大训练数据,模型对物理规律的遵循将越来越好。这一结果可为视频生成模型继续提升表现提供启发。
据了解,本研究两位核心一作都非常年轻,一位是95后,一位是00后,在豆包大模型团队专注视觉领域的基础研究工作。作者们一直对世界模型感兴趣,在8个月的探索中,他们阅读了大量物理学研究文献,也尝试从游戏中获得研发灵感,历经多次失败后,最终一步步确定研究思路和实验方法。
友链
外链
互链
Copyright © 2023 Powered by
六合彩图库源码【购买联系电报bc3979】AC彩票网站源码|六合彩源码|彩票搭建|新中原六合彩源码|【网站bc9797.com】六合彩论坛源码【联系飞机bc3979】
sitemap
-
文章
22247
-
浏览
3
-
获赞
92
热门推荐
-
维纳尔杜姆:不开心在巴黎的处境 荣幸做梅西队友
维纳尔杜姆:不开心在巴黎的处境 荣幸做梅西队友_时间www.ty42.com 日期:2021-10-12 08:01:00| 评论(已有306473条评论)巴黎圣日耳曼签18岁葡萄牙国脚,雷恩签下法国中锋
巴黎圣日耳曼签18岁葡萄牙国脚,雷恩签下法国中锋2022-09-02 18:31:43欧洲五大联赛的转会窗已经在今天凌晨陆续关闭,不少球队完成了压哨签约,让我们对法甲的截止日交易做一个汇总。大巴黎签下十二种颜色搭配口诀表(十二种颜色搭配口诀表水彩)
十二种颜色搭配口诀表十二种颜色搭配口诀表水彩)来源:时尚服装网阅读:1562色彩颜料配色口诀。1、蓝色 + 白色 = 粉蓝 黄色 + 白色 = 米黄 说明:颜料中任何一种颜色加入白色都会使之变为粉色变邮报:图赫尔和伯利在诸多事情上意见不一
邮报:图赫尔和伯利在诸多事情上意见不一 2022年09月08日 在谈到图赫尔下课相关内情时,《每日邮报》透露,图赫尔曾询问球员哪些想要留下,哪些想要离队,得到的答案让他不满意。《每日邮报》表华商储备商品管理中心再次向市场投放中央储备肉
根据商务部、发展改革委、财政部和中国农业发展银行的通知要求,2016年1月22日,华商储备商品管理中心再次组织实施了出库竞价交易。此次交易挂牌中央储备冻猪肉总量1.26万吨, 提货库点为浙江华统肉制品太平洋建设甘肃省兰州市城关区项目通过验收
9月7日,由太平洋建设承建的甘肃省兰州市城关区青白石低丘缓坡沟壑等未利用地综合开发利用项目一期)顺利通过验收。由七位专家验收组牵头、兰州市国土资源局、甘肃省水电设计院、甘肃省水纹地质勘察院、青30年来首次英超垫底!曼联1战造多项耻辱 球迷:降级吧
8月14日报道:在本赛季第2轮联赛中,客场0-4惨败给。这场失利让曼联创造了多项纪录,并且受到了球迷和专家们的集体嘲讽。本赛季首轮英超曼联就在主场1-2负于布莱顿,而本场比赛又在客场0-4失利,两轮过法甲直播:南特vs巴黎圣日耳曼,双方球队差距明显
法甲直播:南特vs巴黎圣日耳曼,双方球队差距明显2022-09-03 17:18:57本场比赛将继续为大家带来2022-2023赛季法甲联赛第六轮的精彩对决:南特vs巴黎圣日耳曼,比赛将在北京时间20Air Max 97 鞋款全新珍珠白配色释出,小姐姐专享
潮牌汇 / 潮流资讯 / Air Max 97 鞋款全新珍珠白配色释出,小姐姐专享2020年02月21日浏览:2764 不论是为东京奥运会打造的“金子弹”还是细节满满的进球回放:津琴科凌空爆射破门 瑞典暂0
进球回放:津琴科凌空爆射破门 瑞典暂0-1乌克兰_禁区www.ty42.com 日期:2021-06-30 04:01:00| 评论(已有287973条评论)蒙牛乳业入选2023年中国上市公司ESG优秀实践案例
11月16日,中国上市公司可持续发展大会在北京举行。会上,中国上市公司协会发布了包括《中国上市公司 ESG 最佳实践案例》在内的多个报告,并为相关企业颁发“上市公司 ESG 最佳实践引江集团召开经营中心、PPP中心成立专项会
9月13日,引江集团经营中心、PPP中心成立专项会议在淮安顺利召开。引江集团董事局主席许立春、CEO王东出席会议,集团机关高管及资本、经营全体人员参加会议。引江集团董事局副主席苗雪飞主持会议。马连奴箱包属于哪个品牌(马连奴的包是真皮吗)
马连奴箱包属于哪个品牌(马连奴的包是真皮吗)来源:时尚服装网阅读:1551马连奴.奥兰迪这个牌子的皮包怎么样?中档价位。马连奴奥兰迪主张演绎快时尚,其品牌皮包价位在200元至1500元不等,致力于将国通神榜慕容雪神怎么解锁
通神榜慕容雪神怎么解锁36qq8个月前 (08-14)游戏知识49南海三集团召开安全会议暨秋季大比武动员会
9月11日,太平洋南海第三建设集团安全会议暨秋季大比武动员会在贵州省黔南州独山县召开。太平洋南海建设集团监事会主席张万俊,太平洋南海第三建设集团董事局主席王祚峰、监事会主席郑超、各片区负责人、