随笔 / AI 实践 · 工具判断

先拿到 Beta,再谈 Alpha

· AI Coding Alpha/Beta 工具判断

多数时候,先拿到 Beta,比到处追 Alpha 更成熟。AI 时代尤其如此:通用能力交给成熟工具,自己守住业务判断和边界。

今天群里又聊起 AI 魔改。

有人在试 prompt,有人在折腾 MCP,有人在研究各种 wrapper 和 harness。这个场景我太熟了。AI coding 之后,很多东西都变得很容易起手。以前一个人想搭一套工具链,至少会先被工程成本劝退一半。现在不一样,AI 一晚上就能帮你拉出个第一版,于是大家都会忍不住想:我是不是也可以改一点、接一点、包一层、再造一个更适合自己的东西。

然后陈然出来讲了一段 Alpha 和 Beta。

他的大意是:大多数人总想在人生各处找 Alpha。投资要 Alpha,职业要 Alpha,关系要 Alpha,身体也想要 Alpha。但现实是,人不可能在所有地方都拿超额收益。更舒服的状态,是大多数地方吃 Beta,少数地方追 Alpha。放到 AI coding 里,Claude Code、Codex 这些最先进的工具,本身就是 Beta。至于各种 prompt、MCP、魔改、harness,很多时候是在追 Alpha,不一定比工具自然升级带来的收益更高。

我当时的反应是:这话挺准。

它准在边界感。

很多人对“用现成工具”这件事有点心理负担,好像不用自己改一层,就不算高级;不自己搭一套,就不算懂;不做点差异化,就只是一个普通用户。但我现在越来越觉得,能承认自己大多数时候应该先拿 Beta,本身就是一种成熟。

这不是懒。

这是你知道哪些收益本来就不该靠自己硬造。

投资里最朴素的例子就是指数。很多人研究主动基金、择时、个股、行业轮动,最后长期收益还不如一只低成本指数。信用卡也差不多。你可以把各种积分、返现、权益研究到很细,但如果你的时间本身更贵,一张简单稳定的返现卡可能已经够好。

AI 工具也是这个逻辑。

如果 Claude Code 已经是当前最强的一档,那就先用 Claude Code。如果 Codex 在某些任务上更顺手,那就用 Codex。如果公司内部有成熟平台,先接成熟平台。模型、工具协议、agent runtime、trace、eval、guardrails、权限、审计,这些通用复杂性,能交给专业工具和专业团队,就不要急着自己背回来。

AI 很容易制造一种错觉:因为第一版太容易做,所以这件事就值得自己做。

但第一版不是最贵的。长期托付才是。

你今天让 AI 写一个 harness,可能很快。真正麻烦的是后面:模型升级了怎么办,工具协议变了怎么办,日志够不够查,错误怎么复盘,权限怎么兜住,谁来维护,谁来解释,出了问题谁负责。AI 能降低制造成本,但不会替你承担责任链。

所以我很认可陈然这个态度:大多数时候,先吃 Beta。

这句话放在 AI coding 里,不是在说“别创造”。它是在提醒人,先别把创造力花在最不划算的地方。通用能力会被大模型厂商、工具厂商、开源社区反复卷。个人和普通团队在这一层硬追 Alpha,很容易追成负债。

真正应该守住的,是自己的那部分。

对我来说,这部分不是通用 agent runtime,不是每一个 prompt 技巧,也不是所有 MCP 的魔改能力。更可能是业务语义、私有上下文、判断标准、验收方式、责任边界和组织里的落地路径。

模型不知道你的业务为什么重要。工具不知道哪个错误在你这里最危险。平台不知道你们组织里谁能审批、谁要兜底、谁会在真实流程里使用它。

这些东西才是自己的 Alpha。

所以我更愿意把这件事说成一句很土的话:

通用能力吃 Beta,业务判断守 Alpha。

不要从零造发动机,但方向盘也不能交出去。

这也是我之前讲 Agent 时反复强调的东西。做 Agent,不是所有模块都自己做。真正有价值的,是把成熟 harness 包到核心、稳定、可验证的业务场景里。业务同学负责定义问题、提供上下文、判断结果、明确风险边界。平台团队负责让它可追踪、可评测、可审计、可兜底。不是每个人都从头搭一套 agent 基础设施。

专业的人使用专业工具,依然会比非专业的人更专业。工具变强不会让边界消失,只会让边界更重要。

说到这里,我基本是站在陈然这一边的。

大多数人确实应该少证明自己聪明一点,多先拿确定收益一点。尤其在 AI coding 这件事上,不要因为 AI 能帮你写代码,就重新变回手工业者。以前是“我做不出来”,现在变成“我都能做出来”。但“能做出来”和“应该由我长期负责”,中间差得很远。

不过我也想补一层边界。

不是所有魔改都该被打成低收益 Alpha。

群里很多人折腾 prompt、MCP、小工具,不一定是为了立刻比 Claude Code 或 Codex 更强。有些人是在学习 AI,在摸工具边界,在理解 prompt 为什么会影响结果,在试 MCP 能不能接进自己的工作流,在用一个小工具建立体感。

这种探索不能只用收益率衡量。

人并不只是为结果的成功而活。

有些东西的价值,不在于它马上赢了谁,而在于它让你更理解一个工具,更接近一个新领域,或者只是让你在快速变化的环境里保持一点参与感。学习本身有价值,兴趣本身也有价值。不是所有东西都需要被包装成战略。

关键是别混淆。

如果你要的是业务结果,那就别拿探索当借口消耗主线。先用最好的工具,先拿确定的 Beta。

如果你要的是学习,那就承认它是学习。给它一点比例,做完有反馈,有复盘,有沉淀。

如果你只是觉得好玩,那也没问题。只是别把每一次好玩都说成“我在追一个很重要的 Alpha”。

我觉得更舒服的状态大概就是这样:大多数地方先拿 Beta,少数真正属于自己的地方追 Alpha,另外保留一点不以胜负为目的的探索。

这比到处证明自己聪明要健康。

也更像一个成年人该有的取舍。