类Sora模型到底懂不懂物理?字节完成系统性实验证明
Sora爆火以来,模明“视频生成模型到底懂不懂物理规律”受到热议,型到系统性实但业界一直未有研究证实。底懂近日,不懂字节跳动豆包大模型团队公布最新论文,物理完成研究历时8个月,字节围绕“视频生成模型距离世界模型有多远”首次在业界完成系统性实验并给出明确结论:视频生成模型可以记忆训练案例,验证但暂时还无法真正理解物理规律,模明做到“举一反三”。型到系统性实
图灵奖得主、底懂Meta首席AI科学家杨立昆点赞并转发了该研究,不懂表示“结论不令人意外,物理完成但很高兴终于有人做了这个尝试!字节”
自OpenAI发布Sora模型以来,验证很多视频生成模型都会强调其生成结果对物理规律的模明遵循。豆包大模型视觉团队相关小组,对视频生成模型究竟能否从视觉数据中“发现”并“理解”物理定律感到好奇,决定深入研究。
历时8个月,该团队完成了业界首个系统性的实验研究。团队通过专门开发的物理引擎合成了匀速直接运动、小球碰撞、抛物线运动等经典物理场景的运动视频,用于训练基于主流DiT架构的视频生成模型。然后,通过检验模型后续生成的视频在运动和碰撞方面是否符合力学定律,判断模型是否真正理解了物理规律,并具有“世界模型”的潜力。
实验中设计的不同运动场景
豆包大模型团队的实验发现,即使遵循“Scaling Law”增大模型参数规模和数据量,模型依然无法抽象出一般物理规则,做到真正“理解”。
以最简单的匀速直线运动为例,当模型学习了不同速度下小球保持匀速直线运动的训练数据后,给定初始几帧,要求模型生成小球在训练集速度区间内匀速直线运动的视频,随着模型参数和训练数据量的增加,生成的视频逐渐更符合物理规律。
然而,当要求模型生成未曾见过的速度区间(即超出训练数据范围)的运动视频时,模型突然不再遵循物理规律,并且无论如何增加模型参数或训练数据,生成的结果都没有显著改进。这表明,视频生成模型无法真正理解物理规律,也无法将这些规律泛化应用到全新的场景中。
通过进一步的实验分析,研究团队得出结论,“生成新视频时,模型主要依赖对训练案例的记忆和匹配。视频生成模型就像一个只会‘抄作业’的学生,一旦遇到从未见过的场景,如不同大小、速度的物体相互作用,就会‘犯迷糊’,生成结果与物理规则不符。”
不过,研究中也有一个好消息:如果训练视频中所有概念和物体都是模型已熟悉的,此时加大训练视频的复杂度,比如组合增加物体间的物理交互,通过加大训练数据,模型对物理规律的遵循将越来越好。这一结果可为视频生成模型继续提升表现提供启发。
据了解,本研究两位核心一作都非常年轻,一位是95后,一位是00后,在豆包大模型团队专注视觉领域的基础研究工作。作者们一直对世界模型感兴趣,在8个月的探索中,他们阅读了大量物理学研究文献,也尝试从游戏中获得研发灵感,历经多次失败后,最终一步步确定研究思路和实验方法。
友链
外链
互链
Copyright © 2023 Powered by
六合彩图库源码【购买联系电报bc3979】AC彩票网站源码|六合彩源码|彩票搭建|新中原六合彩源码|【网站bc9797.com】六合彩论坛源码【联系飞机bc3979】
sitemap
-
文章
63
-
浏览
3158
-
获赞
2
热门推荐
-
国家博物馆五一展览 收藏资讯
【中华收藏网讯】从4月29日开始,我们迎来了为期三天的“五一”小长假,既是和家人欢聚的时光,也是出游、学习充电的好机会。在文化底蕴深厚的北京,像故宫博物院、中国国家博物馆、中国美术馆、首都博物馆,都有华西麻醉镇痛和危急重症医学国际学术周暨第六届华西可视化技术在麻醉镇痛与危重急救中的应用大会召开
5月6-14日,2015年华西麻醉镇痛和危急重症医学国际学术周在我院成功举办。国际学术周是华西麻醉科一年一度的盛会,学术周活动每年推陈出新,内容丰富多彩。今年举办了超声引导神经阻滞培训杰拉德登场38秒踩踏染红 最后的双红会悲剧收场
3月22日报道:北京时间3月23日凌晨,刚刚结束的英超第30轮重头戏中,利物浦主场1-2不敌曼联。比分落后情况下替补出战的杰拉德原本被期待成救世主,但他出场仅仅38秒后,即报复性踩踏埃雷拉,主裁毫不客英超骨灰级神锋轰惊世神仙球 撩衣抹泪+对手道贺
4月6日报道:英超第31轮,桑德兰在主场1-0击败纽卡斯尔一战,迪福有着惊人的演出,他的凌空世界波犹如穿云箭让纽卡门将克鲁尔鞭长莫及,而这样的神作让荷兰门将非常的拜服,在球员通道里,他向迪福进行了祝贺姆巴佩争议球助法国演逆转 同期进球数比肩亨利
姆巴佩争议球助法国演逆转 同期进球数比肩亨利_比赛www.ty42.com 日期:2021-10-11 06:01:00| 评论(已有306284条评论)山东威海“网剑行动”亮“剑”整治市场环境
中国消费者报济南讯记者尹训银)虚假宣传、刷单炒信、价格欺诈……网购中,您遇到过这些乱象吗?为进一步优化网络消费环境和营商环境,近日,山东省威海市市场监管局联合市委宣传部、市山西晋中成立知识产权纠纷人民调解委员会
中国消费者报太原讯记者冯铁飞)为有效预防和化解专利、商标、版权等知识产权纠纷问题,切实维护好知识产权权利人的合法权益,近日,山西省晋中市市场监管局成立了晋中市知识产权纠纷人民调解委员会。晋中市知识产权辽宁沈阳开展创建食安城督导检查
中国消费者报沈阳讯记者王文郁)11月4日,《中国消费者报》记者了解到,辽宁省沈阳市市场监管局创建国家食品安全示范城市督导检查组日前对铁西区和于洪区创建食安城工作开展了督导检查。沈阳市全力创建食安城工作数智赋能驱动融合创新,远光软件亮相2024电力数字化大会
11月6日至7日,2024电力数字化大会在北京举行。大会以“创新驱动、数智引领”为主题,聚焦数字技术在电力行业企业的融合创新应用。中国工程院院士、清华大学教授郑纬民等专家和电力比亨利还快!阿森纳冲刺王蹿红 温格从巴萨挖到宝
4月8日报道:埃克托-贝莱林,这个名字开始红遍英伦。1995年3月19日出生的西班牙右后卫,今年才20岁。阿森纳4-1横扫利物浦一役,贝莱林打爆红军左路,内切之后的左脚弧线球破门给人留下深刻印象。在媒雷纳劝德赫亚留在曼联 红魔两本土后卫或被出售
3月27日报道:最近,西班牙老门将雷纳在接受采访的时候明确劝说国家队小老弟德赫亚,希望其能继续留在曼联,尽管皇马对他非常感兴趣。此外,曼联目前和队内2位本土球员琼斯以及斯莫林的续约工作,仍然迟迟没有展《死侍与金刚狼》最终预告片:金刚狼之女劳拉回归
在距离《死侍与金刚狼》上映还有一周之际,漫威影业忍不住发布了最后一个预告片,揭晓了电影中最重磅的客串之一:达芙妮·基恩回归饰演金刚狼的克隆女儿劳拉/X-23。基恩曾在2017年的《金刚狼3:殊死一战》Air Max 97 鞋款全新珍珠白配色释出,小姐姐专享
潮牌汇 / 潮流资讯 / Air Max 97 鞋款全新珍珠白配色释出,小姐姐专享2020年02月21日浏览:2764 不论是为东京奥运会打造的“金子弹”还是细节满满的Google 离万亿市值的目标越来越远了
雷锋网消息,当地时间4月29日,Google母公司Alphabet对外发布了截止今年3月31日的第一季度财报。在这份财报的开头,Alphabet兼Google首席财务官Ruth Porat表示:在移动悲剧!红军球迷打赌272哑火 输赌约需阉割生殖器
4月8日报道:上周末,英超联赛上演了一场重头戏,结果阿森纳4-1重创利物浦,悲剧的不止是红军将士,还有利物浦的一位铁杆粉丝,据《地铁报》消息,这位球迷打赌厄齐尔不会进球,可是德国人却上演圆月弯刀破门,