类Sora模型到底懂不懂物理?字节完成系统性实验证明
Sora爆火以来,模明“视频生成模型到底懂不懂物理规律”受到热议,型到系统性实但业界一直未有研究证实。底懂近日,不懂字节跳动豆包大模型团队公布最新论文,物理完成研究历时8个月,字节围绕“视频生成模型距离世界模型有多远”首次在业界完成系统性实验并给出明确结论:视频生成模型可以记忆训练案例,验证但暂时还无法真正理解物理规律,模明做到“举一反三”。型到系统性实
图灵奖得主、底懂Meta首席AI科学家杨立昆点赞并转发了该研究,不懂表示“结论不令人意外,物理完成但很高兴终于有人做了这个尝试!字节”
自OpenAI发布Sora模型以来,验证很多视频生成模型都会强调其生成结果对物理规律的模明遵循。豆包大模型视觉团队相关小组,对视频生成模型究竟能否从视觉数据中“发现”并“理解”物理定律感到好奇,决定深入研究。
历时8个月,该团队完成了业界首个系统性的实验研究。团队通过专门开发的物理引擎合成了匀速直接运动、小球碰撞、抛物线运动等经典物理场景的运动视频,用于训练基于主流DiT架构的视频生成模型。然后,通过检验模型后续生成的视频在运动和碰撞方面是否符合力学定律,判断模型是否真正理解了物理规律,并具有“世界模型”的潜力。
实验中设计的不同运动场景
豆包大模型团队的实验发现,即使遵循“Scaling Law”增大模型参数规模和数据量,模型依然无法抽象出一般物理规则,做到真正“理解”。
以最简单的匀速直线运动为例,当模型学习了不同速度下小球保持匀速直线运动的训练数据后,给定初始几帧,要求模型生成小球在训练集速度区间内匀速直线运动的视频,随着模型参数和训练数据量的增加,生成的视频逐渐更符合物理规律。
然而,当要求模型生成未曾见过的速度区间(即超出训练数据范围)的运动视频时,模型突然不再遵循物理规律,并且无论如何增加模型参数或训练数据,生成的结果都没有显著改进。这表明,视频生成模型无法真正理解物理规律,也无法将这些规律泛化应用到全新的场景中。
通过进一步的实验分析,研究团队得出结论,“生成新视频时,模型主要依赖对训练案例的记忆和匹配。视频生成模型就像一个只会‘抄作业’的学生,一旦遇到从未见过的场景,如不同大小、速度的物体相互作用,就会‘犯迷糊’,生成结果与物理规则不符。”
不过,研究中也有一个好消息:如果训练视频中所有概念和物体都是模型已熟悉的,此时加大训练视频的复杂度,比如组合增加物体间的物理交互,通过加大训练数据,模型对物理规律的遵循将越来越好。这一结果可为视频生成模型继续提升表现提供启发。
据了解,本研究两位核心一作都非常年轻,一位是95后,一位是00后,在豆包大模型团队专注视觉领域的基础研究工作。作者们一直对世界模型感兴趣,在8个月的探索中,他们阅读了大量物理学研究文献,也尝试从游戏中获得研发灵感,历经多次失败后,最终一步步确定研究思路和实验方法。
友链
外链
互链
Copyright © 2023 Powered by
六合彩图库源码【购买联系电报bc3979】AC彩票网站源码|六合彩源码|彩票搭建|新中原六合彩源码|【网站bc9797.com】六合彩论坛源码【联系飞机bc3979】
sitemap
-
文章
6
-
浏览
586
-
获赞
4935
热门推荐
-
马连奴箱包属于哪个品牌(马连奴的包是真皮吗)
马连奴箱包属于哪个品牌(马连奴的包是真皮吗)来源:时尚服装网阅读:1551马连奴.奥兰迪这个牌子的皮包怎么样?中档价位。马连奴奥兰迪主张演绎快时尚,其品牌皮包价位在200元至1500元不等,致力于将国古代为何新娘送枣栗这些品项给夫家作为“贽礼”呢?
“门前一株枣,岁岁不知老。阿婆不嫁女,哪得孙儿抱。”这是一首隋‧无名氏作的歌谣 ——《折杨柳枝歌》,俚俗浅白,是为代嫁女儿代言,或是为少年郎传话请婚呢?不得而知,不过我们看到这首民歌里,以“枣树”代指古代很多士兵穿重铠甲,到底能不能防住弓箭呢?
弓弩作为冷兵器时代远距离杀伤的主要武器,古代历来被世界各国军队所重视。在古装战争片中,我们经常看到两军交战时的漫天箭雨,铺天盖地,非常壮观,瞬间很多人命葬黄泉,我们不禁要问,古代弓箭有那么大威力吗?甚项羽不愧是被称为“霸王”的人,他口头禅有多霸气?
说起来,中国其实是一个很爱以成败论英雄的国家,我们经常说成王败寇,不管一个人本身多有才华、之前多么成功,一旦最后失败,那么在史书上就不可能有多么光辉的形象。不过有一个人却是例外。他以败军之将的身份进入中粮各上市公司2016年4月18日-4月22日收盘情况
中粮集团旗下各上市公司2016年4月18日-4月22日收盘情况如下:4月18日4月19日4月20日4月21日4月22日中粮控股香港)06062.522.682.682.912.78中国食品香港)050欧洲的圣诞节是怎样的?欧洲圣诞节有哪些美食?
世界各地的美食,从制作到口味,都能体现不同国家乃至民族的文化传统,例如说西方社会的重要节日——圣诞佳节到来之际,就不是只有人们普遍知道的烤火鸡这一道菜,在欧洲各国,圣诞节的传统食物可以说是丰富多彩,那瓷砖铺贴现大面积空鼓 商家返工重做
中国消费者报南宁讯记者顾艳伟)新房装修完,开心!卫生间墙砖大面积空鼓脱落,气愤!广西壮族自治区柳州市柳城县消费者覃女士在自家新房里,经历着悲喜两重天。柳城县消委会启动诉调对接机制,联合法院介入该起纠纷世界上最年轻的国家分别是哪些?这些国家是怎么排名的?
世界上有两百个国家,那么刚刚成立不久的国家都有哪些呢?你都听说过吗?接下来就让和趣历史来看一下世界上最年轻的国家排名。世界上最年轻的国家排名:波黑、斯洛伐克、捷克共和国、厄立特里亚、帕劳、东帝汶、黑山徐福记酥心糖的简单介绍
徐福记酥心糖的简单介绍来源:时尚服装网阅读:3707徐福记酥心糖的做法?无皮花生烤箱150度烤10-15分钟,花生变色即可。把奶粉和椰丝,均匀撒到花生上,然后撒上棉花糖,烤箱温度调到200度高火,快速象棋中的楚河汉界是怎么来的?楚河汉界与什么历史事件有关?
中国象棋为什么叫楚河汉界?下面趣历史小编就为大家带来详细的介绍,一起来看看吧!中国象棋棋盘上有“楚河汉界”,这是怎么来的呢?“楚河汉界”指的是河南省荥阳市黄河南岸广武山上的鸿沟。沟口宽约800米,深达貔貅有哪些寓意?带貔貅有什么讲究和忌讳?
貔貅的寓意是什么?带貔貅的讲究和忌讳有哪些?趣历史这就为你介绍:貔貅简介貔貅(拼音:pí xiū)别称“辟邪、天禄”,是中国古书记载和民间神话传说的一种凶猛的瑞兽。中国古代风水学者认为貔貅是转祸为祥的世界上最毒的食物是什么?误食后会有什么后果?
今天趣历史小编给大家带来世界上最毒的食物,感兴趣的读者可以跟着小编一起看一看。1、河豚河豚是一种营养丰富、肉质鲜美的食物,不过内脏中含有大量神经性剧毒,这就是令人恐怖的河豚毒素。若是人们误食的话就会出武磊赛后称绝杀球自己没碰到 裁判依然将其算在武磊账下
武磊赛后称绝杀球自己没碰到 裁判依然将其算在武磊账下_越南队www.ty42.com 日期:2021-10-08 03:31:00| 评论(已有305791条评论)古代御医怎么给妃子看病?悬丝诊脉的故事是怎么来的?
宫廷御医怎么给妃子看病是很多人要的问题?下面趣历史小编就为大家带来详细解答。太医院的御医给皇帝看病难,给皇后和妃子们看病更难,尤其给皇后和嫔妃看病更是难上加难。皇宫里“男女授受不亲”的规定十分严厉,于关羽为何穿着“戏子”才穿的绿色的衣服呢?
绿色衣装和帽子都属“贱装”,那么,为什么中国人还要给关羽穿?感兴趣的读者可以跟着趣历史小编一起往下看。英国埃塞克斯大学做了一项研究显示,绿色是很特别的颜色,它既不是冷色,也不是暖色,属于居中的颜色。代