MeshCoder：大语言模型驱动，点云到可编辑结构化物体代码的革新

生成式 AI 的浪潮赋予了机器无尽的创造力，我们已亲眼见证它在文字与图像世界 “点石成金” 的魔力。然而，当这股浪潮涌向更复杂的三维空间，挑战也随之升级。过去的 3D 生成 AI 如孩童堆积木，成果粗糙模糊；如今，它渴望成长为一名 “数字建筑师”，去建造结构精巧、可被编辑改造的虚拟世界。

为了实现这一目标，一种流行的方法是让 AI 学习定义 “内外” 的边界来隐式地塑造物体。这种方法虽能生成外形平滑的物体，但其成果好比一座 “固化” 的雕塑 —— 一个不可分割的静态外壳，很难像玩乐高一样拆解重组。对于艺术家而言，这座雕塑的表面覆盖着一张杂乱的 “渔网”（无序三角网格），而非规整的 “布料”，任何微调都如同对整片网进行重新编织，极其困难，难以融入专业的创作流程。

受到以上启发，我们不再满足于生成杂乱的网格，而是渴望一种更原生、更结构化、更符合设计师与工程师直觉的表征方式 —— 代码。如何让模型像程序员一样，用逻辑和参数构建三维世界？如何让生成的物体不仅形似，更能被理解、被编辑、被二次创作？带着这些思考，我们团队推出了MeshCoder。它是一条探索 3D 程序化生成的新路径，其核心思想是训练一个强大的多模态模型，直接将三维输入（如点云）翻译成结构化、可执行的 Blender Python 代码。

我们工作的亮点在于，MeshCoder 生成的不是一个 “死” 的模型，而是一套 “活” 的程序。它具有以下鲜明优势：

1.分零部件生成：如下视频所示，MeshCoder 能理解物体的语义结构，将椅子、桌子等自动分解为椅背、椅腿、桌面等独立部件进行代码生成，逻辑清晰。

2.拓扑良好的四边面：如下图所示，MeshCoder 生成的代码直接构建出高质量的四边面（Quad Mesh）网格，这对于后续的编辑，展 UV 上材质至关重要。