VAST要让人人都能成为创世“神”丨未来产业调研系列—

3D至少已被热烈讨论了十年。3D大模型能否成为最新爆发点?新工具能否开启3D内容创作的新世界,人类与世界交互的新形态?

责任编辑:黄金萍

文字、图片、视频、声音、音乐,AIGC正不断刷新内容创作的上限。

一家成立于2022年11月的中国AI初创企业VAST,一头猛扎进了3D大模型领域,试图在三维空间里开创一个新世界。

他们要造一个大众级别的3D创作者工具,让大众能够实时、零成本、零门槛创作,由此带来3D内容平台的诞生和繁荣。2024年初,他们发布3D生成大模型Tripo 1.0,2024年9月推出Tripo 2.0,目前可做到10秒⽣成形状⼏何,10秒⽣成纹理及PBR(基于物理的渲染),在所有3D生成任务效果中均处于领先地位。

图片

由Tripo生成的3D模型的六视渲染图——“站在水面玻璃球上的火烈鸟”图片来源:VAST官方公众号

VAST号称拥有全世界最大的、两千万的高质量原生3D数据集,同时在CVPR、ICLR、SIGGRAPH等国际顶会上发表了多篇论文,提出3D+2D融合的技术路线,并参与开源了3D生成算法框架threestudio、图生3D算法框架Wonder3D,与Stability AI合作推出3D生成开源模型TripoSR,推动技术线路的收敛,以加快3D行业的发展。

2024年9月下旬,他们完成天使轮和Pre-A轮共计数亿元的融资,并创下迄今3D大模型赛道的最⼤融资金额。

VAST聚集了梁鼎、曹炎培、郭元晨等多位来自清华大学的年轻科学家团队。创始人、CEO宋亚宸,毕业于约翰霍普金斯大学,之后在商汤CEO办公室实习并工作,2021年6月作为联合创始人参与创办AI独角兽MiniMax,2022年底创办VAST。

宋亚宸坦言自己是一个重度游戏爱好者,在与人交谈的时候,他手里还在不停地拼搭一堆积木。他自称“每天的空余时间主要就是打游戏”。在他看来,行万里路和读万卷书,无非是现实体验和虚拟体验的区别,打游戏对他而言只是选择在虚拟世界里体验和思考。

他用“神”创造的世界和人创造的世界,来类比现实世界和3D生成的虚拟世界。他认为,3D大模型赋予了人们创造属于自己的世界的能力,让每个人都能成为造世的“神”,并定义自己的世界规则。

从游戏、XR、元宇宙、具身智能、空间智能到大模型, 3D至少已经被资本界和产业界热烈讨论了十年。眼下,3D生成大模型能否成为3D的最新爆发点?新工具能否开启3D内容创作的新世界,乃至人类与世界交互的新形态?

以下是南方周末研究员与VAST创始人宋亚宸的对话:

打造3D抖音

南方周末:VAST的3D生成大模型Tripo,现在主要能做些什么?

宋亚宸:简单来说,就是输入文字或者图片,输出一个3D模型,它还可以进入游戏、动画、3D打印、工业设计等领域做二次编辑、渲染、驱动。除了静态3D模型,我们也做动态内容的生成,像骨骼自动绑定、动作的生成、场景的生成等等。我们就是在做一个3D的大众级别的创作工具。

南方周末:你如何理解3D这一概念?

宋亚宸:文字、图片、视频、声音,都是信息载体,3D也是信息载体,它的信息密度和自由度是最高的,还可以做双向交互,是最终极的信息载体。

目前的信息载体,都是3D的降维。如果说,“神”创造了一个3D的世界,就是我们的世界。视频是找个角度和位置去记录3D世界发生了什么,图片是记录其中的一帧画面,文字是

登录后获取更多权限

立即登录

校对:赵立宇

欢迎分享、点赞与留言。本作品的版权为南方周末或相关著作权人所有,任何第三方未经授权,不得转载,否则即为侵权。

{{ isview_popup.firstLine }}{{ isview_popup.highlight }}

{{ isview_popup.secondLine }}

{{ isview_popup.buttonText }}