类Sora模型到底懂不懂物理?字节完成系统性实验证明
Sora爆火以来,模明“视频生成模型到底懂不懂物理规律”受到热议,型到系统性实但业界一直未有研究证实。底懂近日,不懂字节跳动豆包大模型团队公布最新论文,物理完成研究历时8个月,字节围绕“视频生成模型距离世界模型有多远”首次在业界完成系统性实验并给出明确结论:视频生成模型可以记忆训练案例,验证但暂时还无法真正理解物理规律,模明做到“举一反三”。型到系统性实
图灵奖得主、底懂Meta首席AI科学家杨立昆点赞并转发了该研究,不懂表示“结论不令人意外,物理完成但很高兴终于有人做了这个尝试!字节”
自OpenAI发布Sora模型以来,验证很多视频生成模型都会强调其生成结果对物理规律的模明遵循。豆包大模型视觉团队相关小组,对视频生成模型究竟能否从视觉数据中“发现”并“理解”物理定律感到好奇,决定深入研究。
历时8个月,该团队完成了业界首个系统性的实验研究。团队通过专门开发的物理引擎合成了匀速直接运动、小球碰撞、抛物线运动等经典物理场景的运动视频,用于训练基于主流DiT架构的视频生成模型。然后,通过检验模型后续生成的视频在运动和碰撞方面是否符合力学定律,判断模型是否真正理解了物理规律,并具有“世界模型”的潜力。
实验中设计的不同运动场景
豆包大模型团队的实验发现,即使遵循“Scaling Law”增大模型参数规模和数据量,模型依然无法抽象出一般物理规则,做到真正“理解”。
以最简单的匀速直线运动为例,当模型学习了不同速度下小球保持匀速直线运动的训练数据后,给定初始几帧,要求模型生成小球在训练集速度区间内匀速直线运动的视频,随着模型参数和训练数据量的增加,生成的视频逐渐更符合物理规律。
然而,当要求模型生成未曾见过的速度区间(即超出训练数据范围)的运动视频时,模型突然不再遵循物理规律,并且无论如何增加模型参数或训练数据,生成的结果都没有显著改进。这表明,视频生成模型无法真正理解物理规律,也无法将这些规律泛化应用到全新的场景中。
通过进一步的实验分析,研究团队得出结论,“生成新视频时,模型主要依赖对训练案例的记忆和匹配。视频生成模型就像一个只会‘抄作业’的学生,一旦遇到从未见过的场景,如不同大小、速度的物体相互作用,就会‘犯迷糊’,生成结果与物理规则不符。”
不过,研究中也有一个好消息:如果训练视频中所有概念和物体都是模型已熟悉的,此时加大训练视频的复杂度,比如组合增加物体间的物理交互,通过加大训练数据,模型对物理规律的遵循将越来越好。这一结果可为视频生成模型继续提升表现提供启发。
据了解,本研究两位核心一作都非常年轻,一位是95后,一位是00后,在豆包大模型团队专注视觉领域的基础研究工作。作者们一直对世界模型感兴趣,在8个月的探索中,他们阅读了大量物理学研究文献,也尝试从游戏中获得研发灵感,历经多次失败后,最终一步步确定研究思路和实验方法。
友链
外链
互链
Copyright © 2023 Powered by
六合彩图库源码【购买联系电报bc3979】AC彩票网站源码|六合彩源码|彩票搭建|新中原六合彩源码|【网站bc9797.com】六合彩论坛源码【联系飞机bc3979】
sitemap
-
文章
9
-
浏览
5383
-
获赞
17519
热门推荐
-
曼晚为曼联评分:安东尼2分最低,梅努、小麦、霍伊伦8分最高
英超第22轮,曼联客场4-3险胜狼队,赛后,《曼市》为曼联全队评分,替补登场的安东尼2分最低,进球功臣梅努、麦克托米奈、霍伊伦等人8分并列最高。 《曼市》为曼联全队评分 门将:奥纳纳4分后卫:达洛特8揭秘精忠杨家将为何杨业战死皇帝要大发雷霆?
精忠杨家将为什么杨业战死皇帝要大发雷霆?其实,在986年的“歧沟关之战”中,最让宋太宗痛惜的是杨业之死。杨业,本名重贵,又名继业,麟州新秦(今陕西神木北)人。杨业从小就擅长骑射,爱好打猎,武艺高强,二最好色皇帝:一次泡一车美女当27天皇帝被轰下台
今人曾戏言,人生的状态就是起起落落的循环。汉废帝刘贺在他短短三十来年的岁月间,经历了荣华富贵到被迫平庸的曲折,身份也从王爷上升到到皇帝,英年时又被削贬成侯爵。他的一生有着浓厚的戏剧色彩,人生最巅峰的时喀什机场开展消防隐患排查
通讯员 张思远)为进一步加强两会、冬奥会、残奥会期间隐患排查,喀什机场于3月7日组织开展消防安全检查。 检查中,消防人员对各部门及候机楼周边整体环境做摸排,重点检查楼层安全出口是否通畅,安全疏散标匡威 x OFFICE 全新联名 Chuck 70 独占配色鞋款释出
潮牌汇 / 潮流资讯 / 匡威 x OFFICE 全新联名 Chuck 70 独占配色鞋款释出2020年02月27日浏览:3057 去年的 All Star 独占豹纹系莎车机场着力推进“四大园地”标准化建设
通讯员 胡亭亭)春风送暖,万物勃发,又逢植树添绿好时节。3月12日是植树节,莎车机场全体职工一起行动,把绿色种进春天里。 为整合机场土地资源,提高利用率,持续做好机场环境改善,以标准化建设&ld华北空管局指挥部开展首都机场新建场面监视雷达工程实地踏勘工作
为做好承建的首都机场新建场面监视雷达工程,加快推进工程建设进度,3月17日,华北空管局指挥部组织设计、地勘等单位开展建设场址的实地踏勘工作。 首都机场新建场面监视雷达工程主要内容包括:北坪西西南空管局培训中心赴广元机场开展中小机场管制复训建模调研
为深入贯彻民航西南地区管理局关于进一步提升西南地区中小机场管制员资质能力建设的要求,做好管制员复训改革试点工作,西南空管局培训中心管制情报业务培训室于3月14日-16日赴广元机场开展建模调研工作,培训黑龙江省深入推进食品安全风险排查整治专项行动
中国消费者报哈尔滨讯记者刘传江)随着中秋节、国庆节的临近,为扎实推进限上餐饮业经营者入统工作及中小学“学生餐”突出问题专项治理工作,持续深化“防风险、保安全、迎大庆情暖三月天,欢乐妇女节
(通讯员:王向丽)阳春三月节日到,乍寒初春暖意融;庆祝三八联欢会,业余生活来丰富。积极态度创业绩,爱岗敬业令人佩;家庭事业双丰收,伟大女性更生动。平凡岗位注热情,馥郁芬芳似花开;细致严谨站窗口,铿锵玫历史上真实的后羿身为一国之君妻子被人抢走
夏王朝的帝禹是一代圣君,第二代帝启也可以说得上是一代明君,但是第三代的太康则是一位实打实的昏君了。太康继承了父亲启的王位后,不治理政事,不体恤民生,放情纵欲,一味喜好游乐,丧失了做人君的德行,因此失去高湛的结局 历史上北齐武成帝高湛怎么死的?
高湛(537年-568年),小字步落稽,河北景县人,北齐第四任皇帝(561年-565年在位),东魏权臣高欢第九子,高洋同母弟,母娄氏。皇建二年(561年),受遗诏即位。河清四年(565年),传位于太子霍伊伦数据:生日夜连续4场破门,预期进球0.14,获评7.5分
2月5日讯 英超第23轮,曼联3-0击败西汉姆,迎来21岁生日的霍伊伦连续4场破门,他出战88分钟,赛后获评7.5分。附霍伊伦本场数据:射门:2次射正:1次尝试过人:2次成功1次丢失球权:11次越位:三国最强谋士贾诩一人之力改变了整个三国格局
大家都熟读三国演义,提到最厉害的谋士,绝对都会异口同声地说是诸葛亮,但事实真是如此吗?听我道来。窃以为诸葛亮最厉害的是“智”,而是“谋”。三国中的谋士有很多,贾诩、郭嘉、许攸等都是。如果一定要选一个最塔城机场积极做好不正常天气航班保障工作
通讯员:赵志刚 张建波)近日,塔城地区连续发生大风、雨雪及低能见度等恶劣复杂天气,对塔城机场运行保障造成不利影响,为切实做好当前时节航班保障工作,塔城机场采取系列措施,积极做好不正常天气下的航班保障工