类Sora模型到底懂不懂物理?字节完成系统性实验证明
Sora爆火以来,模明“视频生成模型到底懂不懂物理规律”受到热议,型到系统性实但业界一直未有研究证实。底懂近日,不懂字节跳动豆包大模型团队公布最新论文,物理完成研究历时8个月,字节围绕“视频生成模型距离世界模型有多远”首次在业界完成系统性实验并给出明确结论:视频生成模型可以记忆训练案例,验证但暂时还无法真正理解物理规律,模明做到“举一反三”。型到系统性实
图灵奖得主、底懂Meta首席AI科学家杨立昆点赞并转发了该研究,不懂表示“结论不令人意外,物理完成但很高兴终于有人做了这个尝试!字节”
自OpenAI发布Sora模型以来,验证很多视频生成模型都会强调其生成结果对物理规律的模明遵循。豆包大模型视觉团队相关小组,对视频生成模型究竟能否从视觉数据中“发现”并“理解”物理定律感到好奇,决定深入研究。
历时8个月,该团队完成了业界首个系统性的实验研究。团队通过专门开发的物理引擎合成了匀速直接运动、小球碰撞、抛物线运动等经典物理场景的运动视频,用于训练基于主流DiT架构的视频生成模型。然后,通过检验模型后续生成的视频在运动和碰撞方面是否符合力学定律,判断模型是否真正理解了物理规律,并具有“世界模型”的潜力。
实验中设计的不同运动场景
豆包大模型团队的实验发现,即使遵循“Scaling Law”增大模型参数规模和数据量,模型依然无法抽象出一般物理规则,做到真正“理解”。
以最简单的匀速直线运动为例,当模型学习了不同速度下小球保持匀速直线运动的训练数据后,给定初始几帧,要求模型生成小球在训练集速度区间内匀速直线运动的视频,随着模型参数和训练数据量的增加,生成的视频逐渐更符合物理规律。
然而,当要求模型生成未曾见过的速度区间(即超出训练数据范围)的运动视频时,模型突然不再遵循物理规律,并且无论如何增加模型参数或训练数据,生成的结果都没有显著改进。这表明,视频生成模型无法真正理解物理规律,也无法将这些规律泛化应用到全新的场景中。
通过进一步的实验分析,研究团队得出结论,“生成新视频时,模型主要依赖对训练案例的记忆和匹配。视频生成模型就像一个只会‘抄作业’的学生,一旦遇到从未见过的场景,如不同大小、速度的物体相互作用,就会‘犯迷糊’,生成结果与物理规则不符。”
不过,研究中也有一个好消息:如果训练视频中所有概念和物体都是模型已熟悉的,此时加大训练视频的复杂度,比如组合增加物体间的物理交互,通过加大训练数据,模型对物理规律的遵循将越来越好。这一结果可为视频生成模型继续提升表现提供启发。
据了解,本研究两位核心一作都非常年轻,一位是95后,一位是00后,在豆包大模型团队专注视觉领域的基础研究工作。作者们一直对世界模型感兴趣,在8个月的探索中,他们阅读了大量物理学研究文献,也尝试从游戏中获得研发灵感,历经多次失败后,最终一步步确定研究思路和实验方法。
友链
外链
互链
Copyright © 2023 Powered by
六合彩图库源码【购买联系电报bc3979】AC彩票网站源码|六合彩源码|彩票搭建|新中原六合彩源码|【网站bc9797.com】六合彩论坛源码【联系飞机bc3979】
sitemap
-
文章
6661
-
浏览
8317
-
获赞
5
热门推荐
-
海港举行新外援见面会 保利尼奥武圣关公造型亮相
海港举行新外援见面会 保利尼奥武圣关公造型亮相_新援www.ty42.com 日期:2021-10-07 12:01:00| 评论(已有305742条评论)保罗战靴 PG4 全新经典黑红配色即将上架,颜值上线中~
潮牌汇 / 潮流资讯 / 保罗战靴 PG4 全新经典黑红配色即将上架,颜值上线中~2020年03月23日浏览:2816 被戏称为“足力健”的保罗·乔治新一代战靴Nike《真人快打1》联动《惊声尖叫》鬼脸11月19日登场
格斗游戏《真人快打1》即将迎来全新联动角色——来自经典恐怖电影系列《惊声尖叫》的鬼脸杀手! 官方最新预告片正式公布了鬼脸杀手的游戏画面,并宣布其将于11月19日抢先体验版正式加入游戏阵容,11月26日英媒:曼联计划听取对格林伍德报价,他和桑乔出售顺位高于安东尼
来源: 据英国媒体Football Insider报道,曼联已经计划今夏听取对格林伍德的报价。消息人士透露,曼联出售桑乔和格林伍德的顺位将在安东尼之前。桑乔和格林伍德目前分别外租多特和赫塔费,均无买AF1 鞋款全新“City Of Dreams”配色上架发售
潮牌汇 / 潮流资讯 / AF1 鞋款全新“City Of Dreams”配色上架发售2020年02月18日浏览:3298 回顾刚刚落幕的全明星赛,各路品牌纷纷推出一系1:2!第97分钟绝杀,曼联沦陷,马奎尔救主失败,滕哈格再创耻辱
进入二月份之后,曼联的势头不错,已经一举拿下了联赛4连胜,继续保持着对于前四的欧冠席位的争夺。英超第26轮,曼联回到能剧场对阵富勒姆,马奎尔虽然终场前打进绝平进球,但阿森纳旧将伊沃比最后时刻上演绝杀好《泰拉科技》开发商Payload继续缩减 再一次裁员
沙盒建造游戏《泰拉科技》开发商 Payload Studios 在我们于8 月报道的裁员后,又于近日进行了又一轮裁员。消息人士告诉媒体 GI.biz,最新一轮裁员有8 人受到影响。上一轮中,公司才建了新百伦 ML850 全新配色系列鞋款上架,高科技元素
潮牌汇 / 潮流资讯 / 新百伦 ML850 全新配色系列鞋款上架,高科技元素2020年04月03日浏览:3621 继此前新百伦发布 327 与 991 鞋款之后,今回樱花粉 Air Max 270 React ENG 鞋款上脚美图赏析
潮牌汇 / 潮流资讯 / 樱花粉 Air Max 270 React ENG 鞋款上脚美图赏析2020年02月21日浏览:4464 自诞生以来,Air Max 270海泰克触摸屏com1通讯(海泰克触摸屏com1通讯异常)
海泰克触摸屏com1通讯(海泰克触摸屏com1通讯异常)来源:时尚服装网阅读:4268同步时钟芯片选哪家?1、生产时钟芯片的厂家很多,MAXIM、TI、ST、INTERSIL、ON、CYPRESS、F美津植秀护肤品怎么样(美津植秀产品怎么样)
美津植秀护肤品怎么样(美津植秀产品怎么样)来源:时尚服装网阅读:2200美津植秀护肤品好不好?这个牌子首先要声明的是广州的牌子,不是日本的,然后这个牌子并不难用,其实使用感还是可以的。因为我是敏感肌,《电锯甜心RePOP》销量远超预期 改善公司财务状况
据Gamebiz报道,《电锯甜心RePOP》开发商母公司Extreme宣布将预期销售额7400万美元上调至7540万美元,净利润由460万美元上调至690万美元。总体来说,与之前预测相比,预计今年销售伊布放狂言:兹拉坦在米兰踢球 米兰就是意甲冠军
伊布放狂言:兹拉坦在米兰踢球 米兰就是意甲冠军_曼联www.ty42.com 日期:2021-10-06 09:01:00| 评论(已有305582条评论)冬雨绵绵,温暖依旧—在雨中寻找生活的诗意
在这个季节的转角,冬雨悄然降临,带着几分寒意,也带着几分静谧。它不如春雨那般细腻温柔,也不似夏雨那般热烈奔放,更没有秋雨的萧瑟凄清。冬雨,以它独有的姿态,静静地诉说着岁月的故事,也激发了我对生活深深的我国最大海上智能油田群日产量创新高 海上智慧油田建设提质升级
11月14日从中国海油获悉,我国规模最大海上智能油田群——恩平15-1油田群76口生产井全部转入生产,日产量超7500吨,创历史新高。恩平15-1油田群位于深圳西南约200公里