Question 1

什么是 AutoFigure？

Accepted Answer

AutoFigure 是一个将论文方法文本转化为完全可编辑 SVG 科研插图的系统。它结合 LLM 生成、SAM3 分割和矢量化技术，生成可自由修改的出版级学术图表。底层研究发表于 ICLR 2026。

Question 2

AutoFigure 的流水线如何工作？

Accepted Answer

AutoFigure 分四个阶段运行：(1) 初始生成 — LLM 从方法文本创建初始栅格草稿；(2) SAM3 分割 — Segment Anything Model 3 检测并标注图标、文字、连接线等独立组件；(3) SVG 布局模板 — 构建带标记占位符的结构化 SVG 线框；(4) 最终组装 — 高质量裁剪图标和矢量化文字注入模板，生成完全可编辑的 SVG。

Question 3

AutoFigure 与 DALL-E 等图像生成器有什么区别？

Accepted Answer

核心区别在于可编辑性。通用图像生成器输出扁平的栅格图像 —— 如果需要移动一个箭头或修正一个错字，就必须重新生成整张图。AutoFigure 输出完全可编辑的 SVG 文件，每个组件（文字、形状、箭头、图标）都可以单独选择、移动、缩放和重新着色。此外，AutoFigure 支持从参考图像进行风格迁移，确保论文中图表风格一致。

Question 4

什么是风格迁移？

Accepted Answer

AutoFigure 可以模仿你提供的任何参考图像的艺术风格。上传一张你喜欢的论文配图，AutoFigure 将生成匹配其配色方案、字体排版和视觉语言的新插图，确保整篇论文保持统一的视觉风格。

Question 5

什么是 SAM3？为什么 AutoFigure 使用它？

Accepted Answer

SAM3（Segment Anything Model 3）是 Meta 的先进分割模型。AutoFigure 使用 SAM3 通过多提示分割来检测和分割初始栅格草稿中的各个图标区域。这使得各独立组件（图标、文字块、连接线）能够被可靠提取，然后作为可单独编辑的元素放入 SVG 模板。

Question 6

什么是 FigureBench？

Accepted Answer

FigureBench 是首个大规模的从长文本生成科研插图的基准测试，公开在 Hugging Face 上。包含 3,300 个样本，涵盖论文（2,900 开发集 + 200 测试集）、博客、综述和教材，文本长度从 352 到 12,732 tokens。评估长上下文推理、高文字密度和结构复杂性等挑战。

Question 7

AutoFigure 需要什么输入？

Accepted Answer

最基本只需要论文的方法文本部分。可选地，你可以提供参考图像进行风格迁移、自定义 SAM3 检测提示词，以及 LLM 提供商配置（Gemini、OpenRouter 或其他 OpenAI 兼容 API）。

Question 8

生成的图表可以编辑吗？

Accepted Answer

可以 —— 这是 AutoFigure 的核心优势。输出为完全可编辑的 SVG。你可以使用 AutoFigure 内置的 svg-edit 画布在浏览器中直接精修，或下载 SVG 在 Adobe Illustrator、Inkscape 或 Figma 等矢量编辑工具中编辑。各个组件可以独立移动、缩放、重新着色和修改。

Question 9

AutoFigure 是开源的吗？

Accepted Answer

AutoFigure 基于 AutoFigure-Edit 构建，后者是一个以 MIT 许可证发布在 GitHub 上的开源研究项目。开源代码库包含核心流水线、SAM3 集成和 Web 界面。FigureBench 数据集以 CC BY 4.0 发布在 Hugging Face 上。AutoFigure（autofigure.org）是一个提供便捷云端版本的商业托管服务，附带额外功能和技术支持。

Question 10

AutoFigure 和 AutoFigure-Edit 是什么关系？

Accepted Answer

AutoFigure-Edit 是发布在 GitHub 上的开源研究框架（MIT 许可证），包含核心流水线（LLM 生成 + SAM3 分割 + SVG 矢量化）、Web 界面和 FigureBench 基准。AutoFigure（autofigure.org）是基于 AutoFigure-Edit 构建的商业 Web 服务，提供云端渲染、额外功能和技术支持，让研究者无需本地部署即可使用。

Question 11

AutoFigure 支持哪些 LLM 提供商？

Accepted Answer

AutoFigure 支持多个 LLM 提供商：Google Gemini（默认 — Gemini 3.1 Flash 用于图像生成，Pro 用于 SVG）、OpenRouter（支持 Gemini、Claude 等模型），以及任何 OpenAI 兼容 API。你可以在设置中配置首选的提供商和模型。

AutoFigure：生成可编辑的科研插图

立即体验 AutoFigure

AutoFigure 示例展示

论文案例

综述案例

博客案例

教材案例

常见问题

开始用 AutoFigure 创作

Auto Figure 的核心创新

系统架构：五阶段流水线

阶段一：栅格生成

阶段二：SAM3 分割

阶段三：SVG 模板化

阶段四：最终组装

阶段五：迭代优化