腾讯放大招!混元3D世界AI模型宣布开源,直接生成可交互世界

【GameLook专稿,禁止转载!】

GameLook报道/在游戏、影视等数字内容产业中,构建一个宏大而精细的3D世界,历来是衡量工业实力的硬指标,也是一项耗时、耗资巨大的工程。一个开放世界游戏的场景美术团队,可能需要上百名艺术家耗费数年时间,才能一砖一瓦地搭建出可供玩家探索的虚拟城市或奇幻大陆。

这种高昂的成本与漫长的周期,一直是悬在所有内容创作者头顶的达摩克利斯之剑。

然而,技术的演进正在为这一古老难题提供新的解法。在2025年世界人工智能大会上,腾讯发布并宣布全面开源其“混元3D世界模型1.0”。根据官方口径,该技术是「业界首个开源可沉浸漫游、可交互、可仿真的世界生成模型,为游戏开发、VR、数字内容创作等领域带来了全新的可能性」。

项目体验地址:https://3d.hunyuan.tencent.com/sceneTo3D

不过虽然官方口径相当高大上,但GameLook第一时间想到的其实是玩梗。就比如借助该技术,或许网友可以将最近大火的上海规则怪谈做成小游戏的形式,让该热梗在AI 2D图的基础上更进一步。

 

对于不熟悉的读者简单介绍一下,最近很火的上海规则怪谈系列梗,可以说就是首个借助AI技术破圈并不断发展的热门梗文化。

具体来看,所谓的「上海规则怪谈」指的是通过虚构一系列在上海生存需要遵守的“规则”,来戏谑和解构大众对于上海“高大上”、“精致”、“排外”等固有印象。

该梗的起源便是网友使用AI绘画工具生成了一张图片,画面中上海的标志性建筑东方明珠塔变成了一座充满未来科技感的“防御塔”,正对着一名手握“蜜雪冰城”奶茶的游客发射激光。而被东方明珠攻击后,可能会被“开除沪籍”,身份证号前三位被篡改,从此成为“乡毋宁”(上海话,意为乡下人)。

而在此基础之上,借助AI,上海规则怪谈又衍生出了全国地标大乱斗。各地网友纷纷加入创作,为自己的家乡设计了对应的“守护神”或“攻击塔”。

比如广州塔(小蛮腰)会时空跳跃到上海,与东方明珠塔对射,保护喝蜜雪冰城的广州人;当游客吃了西湖醋鱼,雷峰塔会变成“治疗塔”为其回血;如果吃热干面时倒入豆浆,黄鹤楼会启动攻击。

在C端,在GameLook看来,类似的AI技术也将成为未来互联网流行文化的发动机。

当然,如果腾讯的“混元3D世界模型1.0”确实能够达到其宣称的效果,如果放到面向企业应用场景的B端,这并非又一个停留在概念演示阶段的AI玩具,而是一套直指行业核心痛点——3D世界生产力——的全新解决方案,也标志着以腾讯为代表的国内巨头,正积极投身于这场重塑数字内容生产管线的全球竞赛。

具体来看,对于这种3D世界的AI技术,与其畅想普通人“一句话创世”的遥远未来,不如先审视这项技术能为当下的专业领域带来哪些切实变革。而目前在GameLook的视角下,或许最先受益的会是游戏和广告这两个高度依赖3D内容的行业。

在游戏开发领域,尤其是大型项目的前期验证阶段,混元3D模型堪称“灵感加速器”。假设一个游戏策划团队构思了一个“蒸汽朋克风格的古代水乡”核心创意,在过去,他们需要等待美术团队花费数周甚至数月,才能制作出一个可供体验的3D原型场景,用以验证玩法、氛围和美术方向。

而现在,主创人员或许只需输入一段描述性文字,AI便能在数分钟内生成一个符合核心概念的3D世界雏形,并能直接导入Unreal Engine或Unity等主流引擎。

这意味着团队可以即时在场景中测试角色的移动、光照效果和基本交互,快速迭代创意。这种将原型验证周期从“月”压缩到“天”甚至“小时”的效率飞跃,极大地降低了试错成本,让更多大胆的创意有了被实现的机会。

同样,在数字广告行业,为客户量身定制沉浸式、互动式的3D体验正成为新趋势。而借助混元3D世界模型,广告公司的创意人员可以快速生成“坐落于雪山之巅的玻璃展厅”或“穿梭于霓虹都市的公路”等多个场景方案,供客户实时预览和挑选。

这不仅提升了提案效率,也让打造轻量化、高品质的互动广告和虚拟体验变得更加灵活和经济。

这项技术之所以能与专业工作流无缝对接,关键在于其背后精巧的技术构想。我们可以将其原理通俗地理解为一个“AI创世两步走”的过程。

第一步,是“画皮”——生成全景图。模型首先会像一个顶级画师,根据用户输入的文字或图片提示(Prompt),利用类似扩散模型的生成技术,绘制出一幅360度无死角的超高分辨率全景图。这幅图决定了整个世界的基础色调、风格和环境氛围。

第二步,也是更核心的一步,是“塑骨”——进行分层3D重建。模型会像一位经验丰富的雕塑家,分析这幅平面的全景图,智能地预估出其中每一个元素的空间深度和3D结构,并将其“雕刻”成一个立体的三维空间。

但它并非生成一个无法修改的整体“石膏块”,而是聪明地将场景中的天空、地表、建筑、植被等元素识别并拆解为独立的、符合行业标准的3D资产(Assets)。这些“零件”可以被开发者在游戏引擎中自由地移动、替换、编辑,甚至为其赋予物理属性。

正是这种“化整为零”再“无缝衔接”的能力,打通了AI内容生成与传统CG工业管线的关键壁垒,使其成为真正可用的生产力工具。

放眼全球,这场围绕AI生成虚拟世界的竞赛早已高手云集。就在不久前,微软Xbox游戏工作室展示了其名为“Muse”的AI模型。如果说腾讯的混元3D模型是一位专注于“静态世界搭建”的建筑师,那么微软的Muse则更像一位精于“动态世界推演”的物理学家。通过学习海量玩家的游戏数据,Muse能够根据单张游戏截图,预测并生成接下来数秒的连贯游戏画面,甚至能理解玩家的实时操作并渲染出相应结果。

两者的路径虽有不同——一个致力于高效构建可交互的“舞台”,另一个则在探索如何让“舞台上的表演”更加智能和自动化——但其目标却殊途同归:将AI深度融入虚拟世界的创造与运行之中。

从微软的Muse到腾讯开源的混元3D世界模型,我们看到的不仅仅是中国科技公司在全球AI应用浪潮中的奋起直追,更是一种战略姿态的体现。

开源,意味着腾讯意图吸引全球开发者共同参与,加速技术迭代,构建一个围绕AI生成3D内容的生态系统。这不仅是一场技术竞赛,更是一场关于未来数字内容生产标准和生态主导权的博弈。

在这个时代,人工智能或许不会完全取代人类创作者,但它正成为一支强大的催化剂,将开发者从繁重、重复的体力劳动中解放出来,去专注于更高层次的玩法设计、叙事构建和创意表达。

如若转载,请注明出处:http://www.gamelook.com.cn/2025/08/575702/

关注微信