类Sora模型到底懂不懂物理?字节完成系统性实验证明
Sora爆火以来,模明“视频生成模型到底懂不懂物理规律”受到热议,型到系统性实但业界一直未有研究证实。底懂近日,不懂字节跳动豆包大模型团队公布最新论文,物理完成研究历时8个月,字节围绕“视频生成模型距离世界模型有多远”首次在业界完成系统性实验并给出明确结论:视频生成模型可以记忆训练案例,验证但暂时还无法真正理解物理规律,模明做到“举一反三”。型到系统性实
图灵奖得主、底懂Meta首席AI科学家杨立昆点赞并转发了该研究,不懂表示“结论不令人意外,物理完成但很高兴终于有人做了这个尝试!字节”
自OpenAI发布Sora模型以来,验证很多视频生成模型都会强调其生成结果对物理规律的模明遵循。豆包大模型视觉团队相关小组,对视频生成模型究竟能否从视觉数据中“发现”并“理解”物理定律感到好奇,决定深入研究。
历时8个月,该团队完成了业界首个系统性的实验研究。团队通过专门开发的物理引擎合成了匀速直接运动、小球碰撞、抛物线运动等经典物理场景的运动视频,用于训练基于主流DiT架构的视频生成模型。然后,通过检验模型后续生成的视频在运动和碰撞方面是否符合力学定律,判断模型是否真正理解了物理规律,并具有“世界模型”的潜力。
实验中设计的不同运动场景
豆包大模型团队的实验发现,即使遵循“Scaling Law”增大模型参数规模和数据量,模型依然无法抽象出一般物理规则,做到真正“理解”。
以最简单的匀速直线运动为例,当模型学习了不同速度下小球保持匀速直线运动的训练数据后,给定初始几帧,要求模型生成小球在训练集速度区间内匀速直线运动的视频,随着模型参数和训练数据量的增加,生成的视频逐渐更符合物理规律。
然而,当要求模型生成未曾见过的速度区间(即超出训练数据范围)的运动视频时,模型突然不再遵循物理规律,并且无论如何增加模型参数或训练数据,生成的结果都没有显著改进。这表明,视频生成模型无法真正理解物理规律,也无法将这些规律泛化应用到全新的场景中。
通过进一步的实验分析,研究团队得出结论,“生成新视频时,模型主要依赖对训练案例的记忆和匹配。视频生成模型就像一个只会‘抄作业’的学生,一旦遇到从未见过的场景,如不同大小、速度的物体相互作用,就会‘犯迷糊’,生成结果与物理规则不符。”
不过,研究中也有一个好消息:如果训练视频中所有概念和物体都是模型已熟悉的,此时加大训练视频的复杂度,比如组合增加物体间的物理交互,通过加大训练数据,模型对物理规律的遵循将越来越好。这一结果可为视频生成模型继续提升表现提供启发。
据了解,本研究两位核心一作都非常年轻,一位是95后,一位是00后,在豆包大模型团队专注视觉领域的基础研究工作。作者们一直对世界模型感兴趣,在8个月的探索中,他们阅读了大量物理学研究文献,也尝试从游戏中获得研发灵感,历经多次失败后,最终一步步确定研究思路和实验方法。
-
文章
9242
-
浏览
8
-
获赞
54996
热门推荐
-
芙清水乳怎么样(芙清水乳成分)
芙清水乳怎么样(芙清水乳成分)来源:时尚服装网阅读:2134芙清凝胶是很火的一款护肤品,芙清凝胶怎么样?它的作用如何?1、芙清抗菌功能性敷料凝胶,主打抗炎修复,适合在痘痘爆发期使用,不仅可以改善痤疮和江西空管分局开展团员青年法治宣讲活动
为深入开展法治宣传教育,在团员青年中牢固树立遵纪守法意识,加强青年职工“8小时之外”行为管理,8月29日,江西空管分局团委组织开展了团员青年法治宣讲活动,分局党委书记滕苏,党委青春启航 未来可期——厦门空管站技术保障部召开2023年新员工座谈会
为帮助新员工更好地融入技术保障部大家庭,尽快适应身份转变,9月20日,厦门空管站技术保障部组织召开2023年新员工座谈会。会议由技术保障部党支部书记杨仁强主持,部门领导、新员工参加会议。会上,7位新员“通用航空法律先行”实务论坛在京举行
1月27日,“通用航空法律先行”实务论坛在京举行。低空经济作为中央经济工作会议明确提出的战略性新兴产业,是未来经济发展的重要引擎之一。相关研究表明,到“十四五”末,我国低空经济对国民经济的综合贡献值将球队陷入危机?克洛普怼记者:写你想写的,你低估了球迷的智慧
1月30日讯 利物浦主帅克洛普今天出席对阵切尔西的赛前新闻发布会,谈到了范迪克的未来。你宣布赛季末离任后,范迪克等人仅剩18个月合同,球队项目会不会短期内有危机?克洛普:“不,这完全正常。很明显,外界“东风汽车集团全球创新中心 ”落户武汉经开区
荆楚网湖北日报网)讯记者陈泉 通讯员李金友 刘济杭 刘新)1月29日,武汉经开区与东风公司签署深化战略合作专项协议。双方将进一步深化政企合作共建,发挥各自优势,开展更深入、更广泛的合作,在武汉经开区打沙特阿美石油公司:最大可持续产能将维持在每日1200万桶
当地时间30日,沙特阿美石油公司表示,已收到能源部的指示,将其最大可持续产能MSC)维持在每日1200万桶 ,不再继续将其增加到1300万桶。总台记者 张亚宁)阿拉尔机场气象台开展手工编发报技能竞赛
中国民用航空网通讯员冯玉珅讯:目前,航空气象报文编发采用编发报系统自动生成报文,提高了编发报效率,但也造成了在应急情况下,人员人工编发报能力下降明显。为此,近日阿拉尔塔里木机场组织人员开展了人工曼晚为曼联评分:安东尼2分最低,梅努、小麦、霍伊伦8分最高
英超第22轮,曼联客场4-3险胜狼队,赛后,《曼市》为曼联全队评分,替补登场的安东尼2分最低,进球功臣梅努、麦克托米奈、霍伊伦等人8分并列最高。 《曼市》为曼联全队评分 门将:奥纳纳4分后卫:达洛特8踔厉奋发强国防 砥砺奋进学女排——厦门空管站管制运行部党总支开展主题党日活动
为进一步加深对总体国家安全观的理解和把握,激励党员干部干事创业的精气神,近日,厦门空管站管制运行部党总支与元翔厦门空港运行指挥中心党支部共赴漳州,与空军某部联合开展主题党日活动。国防教育日宣传拉开了本克拉玛依机场换季期间开展外场气象设备区域除草
通讯员:熊桂梅)10月4日-5日,克拉玛依机场气象设备保障人员对外场自观气象设备的场地进行换季巡查。为使气象外场自动观测设备区域草高满足探测环境保护要求,便于常规自动观测设备的正常使用,对周围超高杂草2023年江苏新增信贷投放居全国第一
中新网南京1月30日电 (徐珊珊)1月30日,中国人民银行江苏省分行召开2024年第一季度新闻发布会,发布最新统计数据。会上公布,2023年,江苏金融总量继续较快增长,新增信贷投放居全国第一,着力稳总007 x 阿迪达斯联乘鞋款上脚图首次曝光,邦德同款!
潮牌汇 / 潮流资讯 / 007 x 阿迪达斯联乘鞋款上脚图首次曝光,邦德同款! 2020年02月22日浏览:3390 近日,Adidas与 007 联乘Ultra B沙特阿美石油公司:最大可持续产能将维持在每日1200万桶
当地时间30日,沙特阿美石油公司表示,已收到能源部的指示,将其最大可持续产能MSC)维持在每日1200万桶 ,不再继续将其增加到1300万桶。总台记者 张亚宁)汕头空管站气象台大打“提前量”,全力应对台风“小犬”
今年第14号台风“小犬”中心于6日22时位于广东省汕尾市南偏东方大约180公里,中心附近最大风力有14级42米/秒),中心最低气压为955百帕,预计,“小犬&rd