Claude Design 不是设计工具，是所有岗位 Agent 化的样板

几个月前 Pencil 刚出来的时候，我觉得它对 Figma 是一次降维打击。

那时候我的判断很简单：Figma 的优势在设计生产，但 AI 正在把生产这件事从画布里抽走。Pencil 把设计搬进 IDE，让设计文件和代码共享 repo、branch、commit、merge，这看上去像是一个更接近 AI Coding 时代的设计工具。沿着这个逻辑看，Figma 的问题不是没有 AI，而是它还站在画布中心思考 AI。

这个判断没有错，但只说对了一半。

最近用 Claude Design，我的判断又变了一次。Claude Design 当然也能生成设计、原型、slide、one-pager，也能导出 PDF、PPTX、HTML，甚至能把设计 handoff 给 Claude Code。但如果只把它看成一个设计工具，就错过了它真正重要的地方。

Claude Design 不是 Anthropic 跨界做了一个 Figma 竞品。它更像是 Anthropic 把 Claude Code 那套工作架构，换了一个介质，搬到了视觉设计里。

这件事比设计工具竞争本身重要得多。

我看到的不是功能，是架构

Claude Design 最让我停下来的地方，不是它生成出来的页面有多好看，而是它的 onboarding。

它不是先问你喜欢什么颜色、什么字体、什么圆角，也不是让你从一个空白画布开始拖组件。它先问：有没有 codebase 可以读？有没有一份能代表你们品牌的 PPT、PDF 或设计文件？然后它从这些材料里抽取 color palette、typography、components、layout patterns，生成一套团队设计系统。之后每个项目都会默认带着这套系统往前走。

这看起来是在解决品牌一致性，实际上是在解决 agent 的工作条件。

一个人类设计师之所以能持续做出"像这个公司"的东西，不是因为他每次都重新思考品牌色，而是因为他脑子里已经沉淀了一套长期有效的默认判断：这个品牌通常用什么节奏，什么视觉语气，什么组件习惯，什么布局密度，什么东西看起来"不像我们"。

Claude Design 做的第一件事，就是把这些默认判断变成 agent 每次工作时都会带上的持久上下文。

这和 Claude Code 里的 CLAUDE.md 是同一件事。Claude Code 文档里说得很清楚：CLAUDE.md 是放在项目里的 markdown 文件，Claude Code 会在每次 session 开始时读取，用来承载 coding standards、architecture decisions、preferred libraries、review checklists 等长期指令。它不是一个 prompt 小技巧，而是让 agent 不必每次从零理解项目的"项目记忆"。

换到设计领域，这份记忆不再是代码规范，而是品牌资产、组件习惯、版式语言和视觉边界。

所以 Claude Design 的关键不是"能不能画图"，而是它先问了一个更底层的问题：

一个设计 agent 要想稳定工作，它每次启动时必须知道什么？

这是我认为它和 Claude Code 完全同构的地方。

真正的统一架构：不是工具，而是 harness

我现在越来越觉得，未来垂直岗位和 AI 结合的最佳实践，不是"给这个岗位做一个 AI 工具"，而是给这个岗位搭一套 agent harness。

这个 harness 至少有五层。

第一层是持久上下文。它回答的是：这个岗位里有哪些东西不应该每次重新解释？对工程师来说，是代码结构、架构约定、测试命令、review 标准。对设计师来说，是品牌系统、组件库、设计原则。对 PM 来说，是核心用户是谁、我们做什么、不做什么、哪些取舍原则高于短期需求。对法务来说，可能是合同模板、风险偏好、审批红线。对投研来说，可能是投资框架、历史案例、估值口径和禁区。

第二层是任务上下文。它回答的是：这一次具体要做什么？用户是谁，目标是什么，输入材料有哪些，约束是什么，失败模式是什么，参考样例是什么。Claude Design 里的 brief、上传文档、网页抓取、inline comment，都是在补这一层。Claude Code 里让它先读 repo、看 issue、跑测试、理解 error log，也是这一层。

第三层是专业技能。它回答的是：这个岗位有哪些可复用的动作流程？Anthropic 对 Agent Skills 的定义很接近这一点：Skill 是一组 instructions、scripts、resources，Claude 可以在相关任务里动态加载；它的核心原则是 progressive disclosure，先只加载 name 和 description，真正需要时再读取完整 SKILL.md，必要时再读取更多文件或运行脚本。

这句话翻译成岗位语言就是：不要把所有专业知识都塞进一次 prompt，而要把可复用的专业流程做成 agent 能按需调用的工作手册。

第四层是可执行介质。工程师的介质是 repo、terminal、IDE、git。设计师的介质是 canvas、HTML、PPT、Canva、Figma、Claude Code handoff。PM 的介质不是 PRD，而是 metrics、用户反馈、原型、issue、launch room、evals。很多人还在问"AI 能不能替我写产物"，但更重要的问题是：AI 到底能在哪里行动？它能读什么，改什么，运行什么，提交什么，交付到哪里？

第五层是评估闭环。没有 evals 的 agent workflow，本质上还是一次性生成。真正可规模化的 agent workflow，一定要有某种"成功长什么样"的可执行定义。工程里是 test、lint、CI、review。设计里可能是品牌一致性、可用性、状态覆盖、视觉偏差检查。PM 里就是 Cat Wu 说的 evals：不需要几百个，10 个好的 evals 就能让团队量化目标、量化进展、看到缺口。

把这五层合在一起，你会发现 Claude Design 和 Claude Code 不是两个产品，而是同一套东西在两个介质里的实例化。

Claude Code 是代码岗位的 agent harness。

Claude Design 是设计岗位的 agent harness。

未来每个岗位都会长出自己的 harness。

这也是 Cat Wu 那段访谈真正重要的地方

我原来读 Cat Wu 那篇访谈，最容易被那句"真正值钱的是判断该写什么"吸引。它当然很对。当代码越来越便宜，判断做什么会更值钱。

但现在把 Claude Design 放在一起看，我觉得更重要的不是这句话，而是她描述的 Anthropic 内部工作方式。

她说 AI 原生产品里，PM 的重点不应该是维护多季度 roadmap，而是想办法让一个 idea 以最快速度到用户手里。她提到团队会做严格的 weekly metrics readout，让每个人理解业务；会有一份团队原则，写清楚核心用户是谁、为什么是他们、愿意牺牲什么；会用 research preview 降低上线承诺成本；工程、marketing、docs、DevRel 之间有非常紧的 launch room，让一个功能准备好后第二天就能推出去。

这不是普通意义上的"PM 用 AI 提高效率"。

这是把 PM 这条链路本身重新架构了。

过去 PM 的工作经常被理解成写 PRD、拉会、对齐路线图、协调资源、推动上线。AI 时代，如果工程速度被 Claude Code 大幅加速，PM 的瓶颈就不再是"怎么把需求写清楚"，而是"怎么让团队更快地从信号走到判断，从判断走到行动，从行动走到验证"。

这条链路可以写成：

信号 → 判断 → 行动 → 验证。

信号来自 metrics readout、核心用户反馈、dogfooding、模型边界测试。

判断来自团队原则、产品品味、对当下模型能力的理解。

行动由 Claude Code、Cowork、内部工具和轻量 launch process 放大。

验证由 evals、用户反馈、research preview 和下一轮迭代完成。

这和 Claude Design 做的事情完全对应。设计师的链路是：

需求理解 → 方向探索 → 产物生成 → 视觉验证 → 工程 handoff。

Claude Design 加速的不是"画一个页面"这一小段，而是把整条链路变成 agent 可以参与、可以沉淀、可以复用、可以 handoff 的系统。

所以 Cat Wu 的访谈和 Claude Design 其实在讲同一件事：AI 不是把某个岗位里的一个动作变快，而是把整个岗位链路变成一个更短的闭环。

真正被替代的不是岗位，而是没有 harness 的岗位

这也是我觉得这轮变化比"设计师会不会被替代"大得多的原因。

很多关于 AI 的讨论还停留在岗位名上：设计师会不会被替代，PM 会不会被替代，工程师会不会被替代，分析师会不会被替代。

但岗位名其实是一个很粗糙的单位。AI 真正冲击的不是岗位名，而是岗位里那些没有被结构化、没有被验证、没有被自动化、没有被沉淀的工作链条。

一个设计师如果只会把需求翻译成静态稿，那部分工作会迅速被 Claude Design 这样的工具吞掉。但如果他能把品牌判断沉淀成设计系统，把常见视觉问题写成评估规则，把探索路径变成可复用 skill，把 handoff 变成能直接进入工程实现的包，他就不是在和 AI 抢"画图"这件事，而是在设计整个设计 agent 的工作环境。

一个 PM 如果只会写 PRD，再把 PRD 扔给工程师，那部分工作也会越来越薄。但如果他能把用户信号接进来，把团队原则写清楚，把判断标准变成上下文，把模糊问题拆成可测试的 evals，把从 idea 到用户的路径压到最短，他做的就不是传统 PM，而是产品链路的加速器。

一个运营、法务、财务、HR、投研人员也是一样。

未来每个岗位都要回答同一个问题：

你能不能把自己岗位里的隐性经验，改造成 agent 可以读取、调用、执行、验证的系统？

能回答这个问题的人，不会被简单替代。回答不了的人，不一定被 AI 替代，但会被那些已经搭好 harness 的同行替代。

所以，Claude Design 的意义不在设计

我现在回头看 Claude Design，觉得它最重要的地方甚至不在设计。

它演示了一件更通用的事：当模型能力足够强，产品的核心不再是给用户一个更强的编辑器，而是给 agent 一个更好的工作环境。

这个工作环境里，要有长期记忆，要有本次任务的上下文，要有可调用的专业技能，要有能行动的介质，要有评估和 handoff 的闭环。

Anthropic 在 context engineering 那篇文章里讲过一个很关键的观点：agent 的关键不只是写好 prompt，而是持续管理进入模型上下文的所有信息，包括 system instructions、tools、MCP、external data、message history 等。上下文本身是有限资源，应该用最小但高信号的信息集，最大化模型产生目标行为的概率。

这句话放到岗位上看，几乎就是下一代职业方法论。

过去一个职业高手的优势，藏在脑子里、经验里、习惯里、判断里。新人跟着他干几年，才能慢慢学会什么该看、什么不用看、什么是红线、什么是好、什么是差、什么时候该推进、什么时候该停。

现在这些东西第一次可以被写进上下文、skills、tools、evals 和 workflow 里。它们不再只是人的经验，而会逐渐变成组织的可执行资产。

Claude Design 把这件事在设计领域演示了一遍。

Claude Code 已经在工程领域演示了一遍。

Cat Wu 描述的 Anthropic PM 工作方式，又在产品管理领域演示了一遍。

它们共同指向同一个结论：

AI 原生岗位的核心，不是人更会使用 AI，而是岗位本身被重新组织成一套 agent 可运行的架构。

最后

所以这次我改的不是对 Pencil 的判断。

Pencil 也好，Stitch 也好，Figma 也好，它们仍然是重要的设计工具。但 Claude Design 让我看到的不是一个新工具，而是一种更底层的迁移：同一套 Claude Code 架构，正在被套到代码之外的每一种专业介质上。

今天是设计。

明天是 PM、运营、销售、法务、财务、投研、客服、HR。

每个岗位最后都会被问同一个问题：你的 CLAUDE.md 是什么？你的 skills 是什么？你的工具接口在哪里？你的 evals 怎么写？你的 handoff 怎么闭环？你的经验能不能从个人直觉，变成 agent 可以工作的环境？

这才是 Claude Design 真正值得看的地方。

它不是设计工具的一次更新。

它是所有垂直岗位 agent 化的一次公开样板。