VAST要让人人都能成为创世“神”丨未来产业调研系列—

3D至少已被热烈讨论了十年。3D大模型能否成为最新爆发点？新工具能否开启3D内容创作的新世界，人类与世界交互的新形态？

南方周末研究员谯雅馨

责任编辑：黄金萍

文字、图片、视频、声音、音乐，AIGC正不断刷新内容创作的上限。

一家成立于2022年11月的中国AI初创企业VAST，一头猛扎进了3D大模型领域，试图在三维空间里开创一个新世界。

他们要造一个大众级别的3D创作者工具，让大众能够实时、零成本、零门槛创作，由此带来3D内容平台的诞生和繁荣。2024年初，他们发布3D生成大模型Tripo 1.0，2024年9月推出Tripo 2.0，目前可做到10秒⽣成形状⼏何，10秒⽣成纹理及PBR（基于物理的渲染），在所有3D生成任务效果中均处于领先地位。

由Tripo生成的3D模型的六视渲染图——“站在水面玻璃球上的火烈鸟”图片来源：VAST官方公众号

VAST号称拥有全世界最大的、两千万的高质量原生3D数据集，同时在CVPR、ICLR、SIGGRAPH等国际顶会上发表了多篇论文，提出3D+2D融合的技术路线，并参与开源了3D生成算法框架threestudio、图生3D算法框架Wonder3D，与Stability AI合作推出3D生成开源模型TripoSR，推动技术线路的收敛，以加快3D行业的发展。

2024年9月下旬，他们完成天使轮和Pre-A轮共计数亿元的融资，并创下迄今3D大模型赛道的最⼤融资金额。

VAST聚集了梁鼎、曹炎培、郭元晨等多位来自清华大学的年轻科学家团队。创始人、CEO宋亚宸，毕业于约翰霍普金斯大学，之后在商汤CEO办公室实习并工作，2021年6月作为联合创始人参与创办AI独角兽MiniMax，2022年底创办VAST。

宋亚宸坦言自己是一个重度游戏爱好者，在与人交谈的时候，他手里还在不停地拼搭一堆积木。他自称“每天的空余时间主要就是打游戏”。在他看来，行万里路和读万卷书，无非是现实体验和虚拟体验的区别，打游戏对他而言只是选择在虚拟世界里体验和思考。

他用“神”创造的世界和人创造的世界，来类比现实世界和3D生成的虚拟世界。他认为，3D大模型赋予了人们创造属于自己的世界的能力，让每个人都能成为造世的“神”，并定义自己的世界规则。

从游戏、XR、元宇宙、具身智能、空间智能到大模型， 3D至少已经被资本界和产业界热烈讨论了十年。眼下，3D生成大模型能否成为3D的最新爆发点？新工具能否开启3D内容创作的新世界，乃至人类与世界交互的新形态？

以下是南方周末研究员与VAST创始人宋亚宸的对话：

打造3D抖音

南方周末：VAST的3D生成大模型Tripo，现在主要能做些什么？

宋亚宸：简单来说，就是输入文字或者图片，输出一个3D模型，它还可以进入游戏、动画、3D打印、工业设计等领域做二次编辑、渲染、驱动。除了静态3D模型，我们也做动态内容的生成，像骨骼自动绑定、动作的生成、场景的生成等等。我们就是在做一个3D的大众级别的创作工具。

南方周末：你如何理解3D这一概念？

宋亚宸：文字、图片、视频、声音，都是信息载体，3D也是信息载体，它的信息密度和自由度是最高的，还可以做双向交互，是最终极的信息载体。

目前的信息载体，都是3D的降维。如果说，“神”创造了一个3D的世界，就是我们的世界。视频是找个角度和位置去记录3D世界发生了什么，图片是记录其中的一帧画面，文字是

登录后获取更多权限

立即登录

校对：赵立宇

欢迎分享、点赞与留言。本作品的版权为南方周末或相关著作权人所有，任何第三方未经授权，不得转载，否则即为侵权。

vast 未来产业 3D大模型