卡内基梅隆大学研究团队发布一项创新性人工智能项目——LegoGPT,该模型可根据自然语言文本自动生成可拼搭的乐高积木设计。项目已在 GitHub 开源,用户可自由下载模型与数据集进行尝试和拓展。
LegoGPT 由自回归大型语言模型驱动,训练数据包括超过47,000块乐高积木组成的28,000多个独特3D 对象。用户只需输入如“一个吉他造型”这样的文本提示,模型便能生成结构合理、可稳定搭建的乐高拼搭方案。
其核心亮点在于搭建过程中的“有效性检查”与“物理感知回滚”机制,确保生成的积木布局不会重叠或漂浮。同时,它也能生成可供人类或机器人按照说明搭建的结构化设计图,并附带文字注释。
研究团队还构建了名为 StableText2Lego 的训练数据集,利用 ShapeNetCore 网格和体素布局生成初始形状,再经过筛选与优化形成最终训练样本。未来,这项技术有望拓展为图像到乐高设计的完整流程,让用户通过上传照片获得创意拼搭方案。
地址:https://avalovelace1.github.io/LegoGPT/