AI 产品最怕的不是功能少,是主路径失守
从 Typeless 的使用落差说起:传统软件的功能膨胀是 UI 债,AI 产品的功能膨胀更像智能债。真正值钱的不是支持更多场景,而是把最初打动用户的主路径守住。
偏"可用 + 可迭代"的东西:能上线、能演示、能复用。
把儿子的扫描科学卷自动切题、OCR 成题库,再做成手机上可直接练习的小应用。当前版本已生成 55 个题目切图,适合家长辅助使用。
操控龙虾发射子弹打碎页面文字:基于 Pretext 文本引擎的趣味交互实验,支持键盘/鼠标/长按散射。
AI 人脸识别 + 面相判词互动小游戏:五维特征分析、20-30 字吉利判词。
实时语音转写与总结:把碎片化口述变成结构化记录。
极简摄影分享页:瀑布流作品墙 + 标签/搜索筛选 + 假上传交互(演示版)。
家庭航班关怀页:聚合深圳↔济宁航线的航班状态、天气与模拟飞行位置,适合手机查看。
多模型 AI 对话应用:支持模型列表、标题生成与聊天接口联调。
基于大 Agent + 子代理架构的知识库优化工具:上传 QA 文件,自动生成多种问题变体,提升知识库召回覆盖率。
原生静态展示站:极简设计、无构建依赖,展示家居风格与空间灵感(北欧/现代/侘寂等)。
输入主题一键生成上联/下联/横批与解释,并支持海报图生成与下载,适配手机端体验。
王氏家族纪念站:承载家族故事、纪念内容与线上浏览体验。
记录一些关于产品、工程和 AI 的思考。
从 Typeless 的使用落差说起:传统软件的功能膨胀是 UI 债,AI 产品的功能膨胀更像智能债。真正值钱的不是支持更多场景,而是把最初打动用户的主路径守住。
AI 越强,人越不能只做"发一句 prompt 的甲方"。它更像一个高吞吐、低摩擦、可反复返工的乙方。甲方的新能力是四件事:讲清需求、写清验收、看懂过程证据、为结果负责。
Claude Design 不是 Anthropic 跨界做了一个 Figma 竞品,它更像是把 Claude Code 那套工作架构,换了一个介质,搬到了视觉设计里。未来每个岗位都会长出自己的 agent 工作环境——今天是设计,明天是 PM、运营、销售、法务、财务、投研、客服、HR。
Claude Design 不是 Anthropic 跨界做了一个 Figma 竞品,它更像是把 Claude Code 那套工作架构,换了一个介质,搬到了视觉设计里。未来每个岗位都会长出自己的 agent 工作环境——今天是设计,明天是 PM、运营、销售、法务、财务、投研、客服、HR。
Skill 作为产品会自我消解,作为接口会重新分配价值。真正要研究的不是 Skill 怎么赚钱,而是它把哪部分知识变便宜之后,哪部分能力开始变贵。
团队真正要维护的,不再是一份统一知识库,而是一套能在运行时塑造 Agent 行为的 Context Infrastructure。
把 Cursor 说成被 SpaceX 收购,事实层面不准确,但这个错法刚好暴露了一件更重要的事:AI coding 正在从工具竞争切到入口与基础设施竞争。
OpenAI、Anthropic、Google 表面上还在讲不同的产品故事,底层真正抢的却是同一件事:不是让你多问几个问题,而是替你把更贵的工作做掉。
各行各业的管理层都在焦虑,程度明显超过以往任何技术变革。根源不是"AI 会替代管理者",而是"定方向"和"做执行"不能再分给不同层级的人了。
大家以为 AI 味只是几个口头禅。更本质的真相是:它太像一个被训练得很好的优等生,努力完整、努力礼貌、努力不犯错,却越来越像平均值。
一条四步工作流,我反复折腾了快一年,才真正把摩擦降到 0。最后让我过关的,不只是脚本写对了,而是我对 AI+工程 的理解变了。
它不负责模型推理,也不替你编排 agent。LaunchDarkly 真正值钱的地方,是把 AI 系统上线后的控制权收回来。
Karpathy 的 LLM Wiki 不是又一个笔记工具。他真正在说的是:知识管理的维护者问题,终于有人接手了。
很多团队还在想着怎么把报表接给 Agent。我越来越觉得,这轮变化真正逼着企业重写的,不是数据入口,而是数据平台的判断力。
这轮变化最值得警惕的,不是“AI 会不会写代码”,而是 agent 正在先压平研发组织里靠信息差、串行流转和人工协调维持运转的中间结构。
Claude 收紧第三方 Agent 接入,表面上像定价争议,实质上是在逼整个行业面对一个更大的问题:真正贵的不是模型,而是低质量编排造成的系统性浪费。
很多人以为自己只是在补 prompt,其实已经在做手工版 RLHF。真正高价值的,不是模型第一次写了什么,而是人后来把它改成了什么。
同样是祭祖,为什么北方怕惊扰先人,南方却怕不够热闹?从一次山东人在湖南扫墓的错愕出发,重新理解中国人面对逝者的不同方式。
与其问哪个行业会被 AI 替代,不如先问这个行业到底靠什么赚钱:是信息中转和规则执行,还是情绪价值、身份认同和责任背书。
AI 时代的校招,不是在找"最会用 AI 的人",而是在找"AI 替代不了的人"——然后确保这些人也会用 AI。
给 AI 补太多错题集,并不会自然让它更稳,反而可能把它从“完成任务”带向“遵守约束”。真正该补的,不只是限制,而是完成定义、验收门槛和系统级工作流。
Pretext 不是一个普通的文字排版库,而是在浏览器里把“文本测量”从 DOM 回流里拆出来,变成可缓存、可编排、可实时重算的基础能力。它厉害的地方,不只是快,而是让文字第一次有机会像图形系统里的几何对象一样,被前端开发者直接操控。
从 Ghostwriter 的多 agent 审稿回路,到 Karpathy AutoResearch 的自动实验循环,我越来越确信:未来真正有价值的 agent,不只是会做事,而是会围绕目标对象,在稳定评估下持续实验、保留有效变化,并把经验沉淀成下一轮能力。
很多 Skill 最后都会从能力沉淀变成流程负担。真正该优化的,往往不是继续把 Skill 写厚,而是补齐 Harness、评测与 Knowhow。
个人的 context infra,不是知识库,也不是一堆 prompt,而是给 AI 配的一套上下文基础设施:规则、记忆、痕迹和编排。
从 Context Engineering 走到 Harness Engineering,真正重要的变化不是上下文更长了,而是 AI 开始拥有自己的记忆、技能,以及持续更新自己的机制。
从飞书、钉钉近期动作出发,拆解 SaaS 为什么会走向 CLI + Skill,以及传统数据分析平台和报表平台该如何跟上;同时明确反对 SaaS 厂商重度重做一个类似 Claw 的通用壳子。
从 153 篇日记里提炼出的个人操作系统:不是你说过什么,而是你一直在做什么。
把 OpenAI 的 harness engineering、Cursor 的 self-driving codebases 与 agent evals 串成一张图:agent-first 软件工程到底在搭什么底座。
很多问题不是"不会做",而是缺一个能跑通的最小闭环。先交付一个可演示版本,让系统开始产生反馈,迭代才有抓手。
我更相信「系统性推进」而不是「一次性完美」。当目标很大时,第一步的价值不是写出最正确的方案,而是做出一个可以运行的版本。
跑通之后,再去优化体验、性能、结构。否则优化的是空气。
真正有价值的不是"问一句得到答案",而是把输入、约束、交付和复用串成一条可重复的流水线。
当你把 AI 当成产品的一部分,它就需要具备:
所以我更喜欢做"带流程的工具",而不是做"单点 demo"。