类Sora模型到底懂不懂物理?字节完成系统性实验证明
Sora爆火以来,模明“视频生成模型到底懂不懂物理规律”受到热议,型到系统性实但业界一直未有研究证实。底懂近日,不懂字节跳动豆包大模型团队公布最新论文,物理完成研究历时8个月,字节围绕“视频生成模型距离世界模型有多远”首次在业界完成系统性实验并给出明确结论:视频生成模型可以记忆训练案例,验证但暂时还无法真正理解物理规律,模明做到“举一反三”。型到系统性实
图灵奖得主、底懂Meta首席AI科学家杨立昆点赞并转发了该研究,不懂表示“结论不令人意外,物理完成但很高兴终于有人做了这个尝试!字节”
自OpenAI发布Sora模型以来,验证很多视频生成模型都会强调其生成结果对物理规律的模明遵循。豆包大模型视觉团队相关小组,对视频生成模型究竟能否从视觉数据中“发现”并“理解”物理定律感到好奇,决定深入研究。
历时8个月,该团队完成了业界首个系统性的实验研究。团队通过专门开发的物理引擎合成了匀速直接运动、小球碰撞、抛物线运动等经典物理场景的运动视频,用于训练基于主流DiT架构的视频生成模型。然后,通过检验模型后续生成的视频在运动和碰撞方面是否符合力学定律,判断模型是否真正理解了物理规律,并具有“世界模型”的潜力。
实验中设计的不同运动场景
豆包大模型团队的实验发现,即使遵循“Scaling Law”增大模型参数规模和数据量,模型依然无法抽象出一般物理规则,做到真正“理解”。
以最简单的匀速直线运动为例,当模型学习了不同速度下小球保持匀速直线运动的训练数据后,给定初始几帧,要求模型生成小球在训练集速度区间内匀速直线运动的视频,随着模型参数和训练数据量的增加,生成的视频逐渐更符合物理规律。
然而,当要求模型生成未曾见过的速度区间(即超出训练数据范围)的运动视频时,模型突然不再遵循物理规律,并且无论如何增加模型参数或训练数据,生成的结果都没有显著改进。这表明,视频生成模型无法真正理解物理规律,也无法将这些规律泛化应用到全新的场景中。
通过进一步的实验分析,研究团队得出结论,“生成新视频时,模型主要依赖对训练案例的记忆和匹配。视频生成模型就像一个只会‘抄作业’的学生,一旦遇到从未见过的场景,如不同大小、速度的物体相互作用,就会‘犯迷糊’,生成结果与物理规则不符。”
不过,研究中也有一个好消息:如果训练视频中所有概念和物体都是模型已熟悉的,此时加大训练视频的复杂度,比如组合增加物体间的物理交互,通过加大训练数据,模型对物理规律的遵循将越来越好。这一结果可为视频生成模型继续提升表现提供启发。
据了解,本研究两位核心一作都非常年轻,一位是95后,一位是00后,在豆包大模型团队专注视觉领域的基础研究工作。作者们一直对世界模型感兴趣,在8个月的探索中,他们阅读了大量物理学研究文献,也尝试从游戏中获得研发灵感,历经多次失败后,最终一步步确定研究思路和实验方法。
友链
外链
互链
Copyright © 2023 Powered by
六合彩图库源码【购买联系电报bc3979】AC彩票网站源码|六合彩源码|彩票搭建|新中原六合彩源码|【网站bc9797.com】六合彩论坛源码【联系飞机bc3979】
sitemap
-
文章
4
-
浏览
43146
-
获赞
17
热门推荐
-
类Sora模型到底懂不懂物理?字节完成系统性实验证明
Sora爆火以来,“视频生成模型到底懂不懂物理规律”受到热议,但业界一直未有研究证实。近日,字节跳动豆包大模型团队公布最新论文,研究历时8个月,围绕“视频生成模型距离世界模型有多远”首次在业界完成系统鹊桥二号里有咱“河南力量”→
3月20日8时31分,探月工程四期鹊桥二号中继星由长征八号遥三运载火箭在中国文昌航天发射场成功发射升空。鹊桥二号中继星作为探月四期后续工程的“关键一环”,将为嫦娥六号等任务提供欧协联法兰克福vs圣吉罗斯联合直播
欧协联法兰克福vs圣吉罗斯联合直播-时间2月23日4点整2024-02-20 10:41:23欧协联赛是备受瞩目的赛事之一,在即将到来的一场比赛中,法兰克福队将对战圣吉罗斯联合队。自从欧协联赛成立以来英超前瞻:曼联VS富勒姆,曼联近7场正赛6胜1平保持不败
英超前瞻:曼联VS富勒姆,曼联近7场正赛6胜1平保持不败2024-02-24 00:15:36北京时间2月24日,2023-2024赛季英格兰超级联赛火热进行中,英超联赛第26轮,曼联VS富勒姆的比赛《星球大战9:天行者崛起》续集电影的编剧又走了
《星球大战9:天行者崛起》电影续集失去了自己的编剧Steven Knight。这部续集由莎梅·奥贝德-奇诺伊Sharmeen Obaid-Chinoy)执导,《星战》新三部曲电影女主黛茜·雷德利主演。2024年美洲杯赛程安排,2024年美洲杯赛制一览
2024年美洲杯赛程安排,2024年美洲杯赛制一览2024-02-23 14:30:40今年的美洲杯将在美国举办,届时将有 10 个南美国家参加,另外还有 6 名北美嘉宾球队,他们将挑战南美足联的强权耐普荣获“东盟强势品牌”奖 引领电池品牌走向世界
日前,在新加坡“2024越南--东盟经济合作论坛”大会上,来自中国广东的NPP耐普新能源,荣获“东盟强势品牌”奖项,彰显行业第一龙头企业地位,以&ldq国内首套蓄热式氧化法顺酐尾气处理装置投运
由天华化工机械及自动化研究设计院研发设计的国内首套蓄热式氧化法顺酐尾气处理装置——年产3万吨顺酐尾气处理装置日前在常州亚邦化学有限公司一次开车成功。苯氧化法顺酐生产中由于尾气中含有有害气体苯,其尾气达足坛刺激夜!梅西替补仍被0
这一个比赛日,世界足坛又迎来了多场看点十足的对决,拥有梅西的美职联球队迈阿密国际,继续自己的热身赛之旅,此役他们奔赴客场挑战C罗领衔的利雅得胜利,不过总裁因伤无法登场,让梅罗对决没有能够再度上演,而迈声称“提前获考题” 培训机构被罚20万
中国消费者报广州讯记者黄劼)广东省广州市中教文化传播有限公司因在招生过程中声称可以提前获得内部考题、学员考试通过率可达90%以上,近日被广州市天河区市场监管局处以20万元的行政罚款。2020年11月1我院参加卫生计生系统羽毛球和太极拳比赛
6月13-14日,由四川省卫生计生委主办、成都中医药大学附院承办的“四川省卫生计生委第七届全民健身运动会”羽毛球项目和太极拳比赛在成都市中医药大学温江校区体育馆举行。我院工会共组织19名羽毛球运动员和曼联锋线PK:范佩西依旧大腿 鲁尼1数据不敌老虎
12月26日报道:曼联坐拥范佩西、鲁尼、法尔考和威尔逊四大前锋,英超官网统计进6球的鲁尼效率最高,他188分钟进一球,机会把握成功率29%;鲁尼和范佩西搭档6场打进6球,这6场比赛曼联场均得分2.33四大首发技术加持 4999元起红魔10 Pro系列发布
2024年11月13日,年度最强电竞旗舰红魔10 Pro系列正式亮相,售价4999元起。这是红魔品牌在电竞领域深度探索的最新成果,引领行业持续提升性能上限,也给用户提供更多流畅且极致的旗舰机选项。11切尔西VS西汉姆前瞻:穆帅再遇"19世纪野蛮足球"
12月25日报道:北京时间12月26日晚间20点45(当地时间中午12点45),2014-15赛季英超第18轮一场焦点战在斯坦福桥球场展开争夺,切尔西主场迎战西汉姆联。在最新的积分榜上,切尔西13胜3完美广西分公司受邀参加无偿献血工作交流会
4月23日,广西南宁市中心血站为增强与各无偿献血爱心企业的友好关系,促进无偿献血公益事业的推动,特别在136庄园召开“建党百年不忘初心,无偿献血你我同行”无偿献血工作交流会。完美广西分公司作为2020