类Sora模型到底懂不懂物理?字节完成系统性实验证明
Sora爆火以来,模明“视频生成模型到底懂不懂物理规律”受到热议,型到系统性实但业界一直未有研究证实。底懂近日,不懂字节跳动豆包大模型团队公布最新论文,物理完成研究历时8个月,字节围绕“视频生成模型距离世界模型有多远”首次在业界完成系统性实验并给出明确结论:视频生成模型可以记忆训练案例,验证但暂时还无法真正理解物理规律,模明做到“举一反三”。型到系统性实
图灵奖得主、底懂Meta首席AI科学家杨立昆点赞并转发了该研究,不懂表示“结论不令人意外,物理完成但很高兴终于有人做了这个尝试!字节”
自OpenAI发布Sora模型以来,验证很多视频生成模型都会强调其生成结果对物理规律的模明遵循。豆包大模型视觉团队相关小组,对视频生成模型究竟能否从视觉数据中“发现”并“理解”物理定律感到好奇,决定深入研究。
历时8个月,该团队完成了业界首个系统性的实验研究。团队通过专门开发的物理引擎合成了匀速直接运动、小球碰撞、抛物线运动等经典物理场景的运动视频,用于训练基于主流DiT架构的视频生成模型。然后,通过检验模型后续生成的视频在运动和碰撞方面是否符合力学定律,判断模型是否真正理解了物理规律,并具有“世界模型”的潜力。
实验中设计的不同运动场景
豆包大模型团队的实验发现,即使遵循“Scaling Law”增大模型参数规模和数据量,模型依然无法抽象出一般物理规则,做到真正“理解”。
以最简单的匀速直线运动为例,当模型学习了不同速度下小球保持匀速直线运动的训练数据后,给定初始几帧,要求模型生成小球在训练集速度区间内匀速直线运动的视频,随着模型参数和训练数据量的增加,生成的视频逐渐更符合物理规律。
然而,当要求模型生成未曾见过的速度区间(即超出训练数据范围)的运动视频时,模型突然不再遵循物理规律,并且无论如何增加模型参数或训练数据,生成的结果都没有显著改进。这表明,视频生成模型无法真正理解物理规律,也无法将这些规律泛化应用到全新的场景中。
通过进一步的实验分析,研究团队得出结论,“生成新视频时,模型主要依赖对训练案例的记忆和匹配。视频生成模型就像一个只会‘抄作业’的学生,一旦遇到从未见过的场景,如不同大小、速度的物体相互作用,就会‘犯迷糊’,生成结果与物理规则不符。”
不过,研究中也有一个好消息:如果训练视频中所有概念和物体都是模型已熟悉的,此时加大训练视频的复杂度,比如组合增加物体间的物理交互,通过加大训练数据,模型对物理规律的遵循将越来越好。这一结果可为视频生成模型继续提升表现提供启发。
据了解,本研究两位核心一作都非常年轻,一位是95后,一位是00后,在豆包大模型团队专注视觉领域的基础研究工作。作者们一直对世界模型感兴趣,在8个月的探索中,他们阅读了大量物理学研究文献,也尝试从游戏中获得研发灵感,历经多次失败后,最终一步步确定研究思路和实验方法。
友链
外链
互链
Copyright © 2023 Powered by
六合彩图库源码【购买联系电报bc3979】AC彩票网站源码|六合彩源码|彩票搭建|新中原六合彩源码|【网站bc9797.com】六合彩论坛源码【联系飞机bc3979】
sitemap
-
文章
324
-
浏览
972
-
获赞
1
热门推荐
-
徐福记酥心糖的简单介绍
徐福记酥心糖的简单介绍来源:时尚服装网阅读:3707徐福记酥心糖的做法?无皮花生烤箱150度烤10-15分钟,花生变色即可。把奶粉和椰丝,均匀撒到花生上,然后撒上棉花糖,烤箱温度调到200度高火,快速persol很贵(pershow什么牌子)
persol很贵(pershow什么牌子)来源:时尚服装网阅读:1243结婚引女婿与伴郎的区别?1、婚礼上如果新娘选择龙凤褂,新郎选择长袍马褂一定不会出错,马褂彰显身份,很贵气,而且与新娘的中式结婚礼电讯报:曼联与弗兰克和波切蒂诺团队会面,滕哈赫对此感到焦虑
5月27日讯 据英媒《每日电讯报》报道,曼联与弗兰克和波切蒂诺团队的团队进行了会面,在就滕哈赫未来做出最终决定之前,他们将继续探索各种选择,滕哈赫对此感到焦虑。滕哈赫于周日开始休假,尽管他带来曼联击败科纳特:无法用言语形容克洛普付出的一切,他已经是利物浦传奇
6月1日讯 近日,利物浦队的法国中卫科纳特在接受专访时谈到了恩师克洛普的离任。5月19日,尤尔根-克洛普告别利物浦,你对他有什么印象?科纳特:“我记得他为俱乐部、这支球队、城市和球迷所做的一切。他为每施耐德电气:共建微网新业态,共赢绿色新质力
伴随全球能源结构的深刻变革,智慧、绿色、灵活的微电网技术正成为构建新型电力系统、推动能源转型的关键力量。11月14日,2024施耐德电气微电网主题沙龙在厦门成功举办。在活动现场,施耐德电气携手众多行业穆帅或再掌切尔西!安菲尔德筹备渣叔雕像
阿森纳跟队记者本雅各布爆料了英超最新动态,切尔西换帅风波未平,穆里尼奥被曝准备接受伯利的合同,有望第三次执教蓝军。同时,安菲尔德也开始筹备克洛普的雕像,以此纪念这位功勋教练的卓越贡献。据悉,穆里尼奥对迪欧化妆品价目表(迪欧女装属于几线品牌)
迪欧化妆品价目表(迪欧女装属于几线品牌)来源:时尚服装网阅读:12661中高端化妆品品牌有哪些?SK-II也是护肤品界的高端产品,凭借这款护肤精华露(也叫神仙水)荣登排行榜,含有品牌特有的pitera广东省超高清电视网络应用产业计量测试中心正式成立
中国消费者报广州讯陈晓莹 记者李青山)近日,广东省市场监管局正式授权广东省计量科学研究院成立广东省超高清电视网络应用产业计量测试中心,开展超高清电视网络应用产业有关量值溯源和计量测试服务工作。超高清视国家食品安全示范城市省级复审组对西安市新城区现场检查
中国消费者报西安讯石明明记者徐文智)9月6日,国家食品安全示范城市省级复审食品经营验收组对陕西省西安市新城区国家食品安全示范城市创建复审工作进行现场验收检查。复审组一行来到西安粮油批发市场,对照食品批打造家中的宁静角落 水景摆件园艺将注重创新与可持续性
水景摆件园艺中的流动水和舒缓的声音可以帮助人们放松心情,减轻压力。观察水景摆件的流动和变化有助于缓解紧张和焦虑情绪,使人们感觉更加平静和舒适。水景摆件园艺的设计灵感通常来自大自然,如瀑布、小溪或池塘等哥俩好,哈弗茨晒与厄德高一起去度假的照片:充电中
在上周末的英超第38轮比赛结束后,本赛季阿森纳的比赛也已经全部结束,球员们迎来了假期,哈弗茨在社交媒体上晒出了自己与厄德高去度假的照片。在照片中可以看到,哈弗茨和厄德高一起去了度假,他们坐在游艇上玩牌麦克托米奈抢点在罗德里干扰下倒地,裁判无表示
05月25日讯 曼联vs曼城第53分钟,曼联反击,B费倒三角,麦克托米奈抢点在罗德里干扰下倒地,裁判无表示。标签:曼城UFC巨星谈C罗:史上最佳 激励了数以百万计的人
UFC巨星谈C罗:史上最佳 激励了数以百万计的人_哈比布www.ty42.com 日期:2021-10-06 09:01:00| 评论(已有305583条评论)该激活民间文物了:美国三家博物馆就是我国文物总量的11倍 收藏资讯
中国文物流失有多严重?可能你从一些报道中可以知道一些,看到国宝流落海外也曾痛心疾首过,但当你确切知道每年中国文物巨大的流失量时你才会真正感觉到震惊和悲哀!中国拥有最悠久的历史,却不是文物大国!中国是文附近悦诗风吟专卖店地址(悦诗风吟电话和地址)
附近悦诗风吟专卖店地址(悦诗风吟电话和地址)来源:时尚服装网阅读:1199西乡天虹有悦诗风衣店吗深圳巴宝莉专卖店有风衣。根据查询相关资料显示:深圳巴宝莉专卖店地址位于广东省深圳市罗湖区宝安南路1881