个人主页

不要想着 AI 能为你做什么,要想着你能为 AI 做什么

我叫 Challen 王。我关注 AI/Agent 工具、工作流自动化、以及把复杂问题拆成可迭代的工程。 这里现在更像一份持续更新的思考日志:随笔是主线,项目是这些判断的阶段性脚注。

最近更新:

项目档案

项目还在,但从首页主舞台退到次级入口:它们是思考落地后的可运行痕迹。

女儿游戏:老妈来了快跑

New

女儿自己设计的横版跑酷:闯过 25 个粉色梦幻关卡,吃到醒目的闪电加速道具甩开老妈。现在支持爸爸、哥哥、妹妹三人轮流选角色,彩蛋会带出烟花、开花、星光等背景动效,并记录各自历史成绩,浏览器即开即玩。

像素俄罗斯方块 · Morandi Tetris

New

莫兰迪色系外壳包裹像素风俄罗斯方块:7 种标准方块 + 7 个彩蛋(Tetris 爆屏、Combo 连击、隐藏异形方块、速通成就、完美着陆、Konami 上帝模式、笑脸双倍分),含 localStorage 战局历史榜与按键自定义。浏览器即开即玩。

GLM5.2 游戏测试

New

像素风贪吃蛇:Canvas 渲染、CRT 扫描线、连击倍率、限时金苹果、里程碑闪屏与彩虹模式彩蛋,含实时战况记录与历史战绩榜。浏览器即开即玩。

怎么看懂宁阳:一个山东县城的导读

New

山东泰安宁阳县的县-镇-村三层导读:10 个县级母题(大汶河、大汶口文化、宁阳文庙、蟋蟀第一镇、八景)+ 15 个乡镇 + 112 个村,每条都标官方出处。

Claude 4.8 实测口碑调研

New

抓取 X 平台 73 条真实推文,看开发者社区对 Claude Opus 4.8 的第一反应:核心结论、4.8/4.7/4.6 横向对比、真实推文墙与编辑判断。

北京城市指引完整镜像

New

Guide Me 北京 61 篇文章的授权完整镜像:保留原有地点导航图,并在每篇地图后嵌入对应导读海报。

Shader Wallpapers

New

5 个交互式 WebGL Shader 壁纸:跟随鼠标变形、点击产生特效。从 Claude Design 导出并用 React + GLSL 实现。

存正清明科学作业

New

把儿子的扫描科学卷自动切题、OCR 成题库,再做成手机上可直接练习的小应用。当前版本已生成 55 个题目切图,适合家长辅助使用。

Pretext 文字打碎游戏

New

操控龙虾发射子弹打碎页面文字:基于 Pretext 文本引擎的趣味交互实验,支持键盘/鼠标/长按散射。

AI 相面 · 春晚特别版

New

AI 人脸识别 + 面相判词互动小游戏:五维特征分析、20-30 字吉利判词。

Brainwave

Active

实时语音转写与总结:把碎片化口述变成结构化记录。

LensRoom · 摄影分享

New

极简摄影分享页:瀑布流作品墙 + 标签/搜索筛选 + 假上传交互(演示版)。

机场路线信息展现

New

家庭航班关怀页:聚合深圳↔济宁航线的航班状态、天气与模拟飞行位置,适合手机查看。

AI Chat Project

New

多模型 AI 对话应用:支持模型列表、标题生成与聊天接口联调。

知识库优化 Agent

New

基于大 Agent + 子代理架构的知识库优化工具:上传 QA 文件,自动生成多种问题变体,提升知识库召回覆盖率。

HomeStyle · 家居风格展示

Active

原生静态展示站:极简设计、无构建依赖,展示家居风格与空间灵感(北欧/现代/侘寂等)。

AI 春联工坊

New

输入主题一键生成上联/下联/横批与解释,并支持海报图生成与下载,适配手机端体验。

Wang Family Memorial

New

王氏家族纪念站:承载家族故事、纪念内容与线上浏览体验。

一些随笔(我的思考)

记录一些关于产品、工程和 AI 的思考。

最危险的不是不用 AI,而是只会用 AI

会用 AI 的人,会先超过不用 AI 的人。但只会用 AI 生产交付物的人,最终会被能用 AI 搭建闭环的人超过。真正的分界不是工具熟练度,而是能不能让工作产生复利。

Loop Engineering 的真正问题不是 Loop

当整个 AI 社区都在讨论 loop engineering,真正被忽略的问题不是怎么设计循环,而是你凭什么判断什么时候该停。Loop 让打字变快了,但思考没有前移。评测才是不可外包的东西。

AI 的我执

AI 的专业感,会遮蔽人的策略判断。真正好的 Agent,应该有一种轻一点的自我。它能形成计划,也能放下计划。

当智能开始需要护照

所以这件事最值得讨论的地方,不是某家公司被迫下线了某个模型,而是一个更底层的变化:智能开始需要护照了。

当 AI 会做事之后,人会重新想要对话

听同事讲到 Chat 和 CLI 两种 AI 模式后的一点思考:未来大众化的不是命令行界面,而是 Agent 式托付;未来小而美的不是聊天窗口,而是高信任深度对话。

Agent 编排,到底在编排什么?

读鸭哥的开源项目之后意识到:AI 能力加入后,软件开发不是流水线,而是更像组织运作——编排不再排工序,测试不再测交付,一切围绕确定性、不确定性和自我迭代重新设计。

用户不再点功能的时候,AI Native 才开始

AI Native 不是 AI 比例问题,也不是模型调用次数问题,甚至首先不是架构问题。它是产品控制权的问题,是责任边界的问题,是用户从操作功能到委托结果的问题。

被封号的那十个小时

十个小时没有 AI,我体验到的不是愤怒或不方便,而是一种从未有过的、很难描述的空。它让我重新检视了一件每天都在做但很少认真想过的事:我和 AI 的关系到底是什么?

别再迷信 Agent 框架了

Agent 能力真正的终局不在框架,不在 MCP,不在 prompt 技巧。它会回到模型的后训练和 trajectory 学习里。

先拿到 Beta,再谈 Alpha

先拿到 Beta 不是懒,而是一种成熟的边界感。通用能力交给成熟工具,自己的业务判断和探索乐趣要分清边界。

走远之后,还能看见门槛

读鸭哥一篇关于 Skill First 的文章后,我真正被触动的不是技巧本身,而是一个高手走远之后,还能不能回头看见别人脚下那一级门槛。

需求不是聊清楚的,是跑清楚的

做评测平台时,我越来越觉得,AI-native 的第一步不是让 AI 写代码,而是让需求本身变成 AI 能参与、人能验收、组织能追责的工作对象。

当图文也开始让人累

一次群聊里的小变化:AI 生成的图文观点从新鲜变成疲劳。真正的问题不是文字好还是图片好,而是信息到底给谁消费、为谁降低成本。

学 AI,不是给大脑刷短视频

AI 时代最危险的一种幻觉,是把“持续接触新东西”误认为“持续成长”。真正的学习,应该逐渐从兴奋走向一种更深的体验。

Deep Research 不够 Deep,不是因为它不够长

Deep Research 的浅,不是因为它搜索得不够多,而是它多数时候还没有自己的研究立场,也没有稳定理解用户的研究立场。Long Research 真正有价值的方向,是把研究变成一个可持续积累上下文、假设、反证和判断标准的过程。

AI Coding 之后,中台要退到哪里?

做 Agent 评测平台的过程中,我开始重新想中台到底该站在哪一层。AI Coding 改变的不只是研发效率,而是中台存在的经济学基础。中台要后退到公共契约和基础设施的位置,同时往方法论和问题定义层走。

AI 走进社会,才发现世界是个草台班子

当 AI 从预训练大学毕业,真正进入社会,它才发现真实世界不是教材、论文和标准答案,而是一座靠旧系统、口头经验、临时补丁和责任链维持运转的城市。未来的关键不是继续感叹落地难,而是建设让 AI 能在真实组织里可靠行动的控制面。

你的 SOP,正在偷走 AI 给你的红利

把 skill 当 SOP 写不是错,错的是把所有 skill 都当 SOP 写。SOP 越是替模型规定 reasoning 路径,越在新模型上折旧;越是定义验收标准、边界和例子,越能跟随模型变强而变强。Anthropic 和 OpenAI 看似分歧的最新建议,其实在用不同语气重申同一件事。

上下文主权:AI 时代,什么才算你的想法

上下文不是越多越好。AI 时代真正重要的,是分清什么是你的,什么只是你看过的。横向分类解决资料放哪,纵向分类解决谁有发言权。否则 AI 放大的不是你,而是互联网平均值。

别把 AI 提效讲成人人都要搭 Agent

一个 HR 团队想学 AI 提效,但真正的问题不是“怎么搭 Agent”,而是怎样判断一个场景应该做网页、MCP、Workflow,还是 Agent。个人工具到组织工具之间,差的不是热情,而是工程稳定、治理和判断力。

用得越多,想得越少:AI 时代的认知退化悖论

161 天每日复盘之后的一个发现:AI 最大的诱惑不是它能做什么,而是它让你可以不做什么。问题不在于用不用 AI,而在于谁先动脑。先独立思考再用 AI 的人,认知网络不受影响;反过来的人,已经回不去了。

一个不存在的平台

中国没有 LinkedIn,不是因为没人尝试,而是因为一整套社会运行机制让这个品类失去了存在的理由。微信占据生态位、关系文化与弱连接文化的根本差异、需求被拆碎到多个平台。而 LinkedIn 在海外正变成"穿西装的 Twitter",中国真正缺的可能是一个轻量实名的职业内容社区。

循环的灵魂在循环之外

Codex /goal 和 Ralph Loop 都说自己在做"循环直到完成"。功能描述一模一样,使用体感天差地别。差异不在 prompt,在循环边界的设计。让同一个 agent 自检,不如让一个新 agent 来外审。这是架构层面的宿命。

让所有人都变聪明的工具,可能让人类集体变蠢

AI 模型训练在彼此的输出上,知识世界正在经历一场静悄悄的"近亲繁殖"。人类文明从来在碰撞中产生创新,在封闭中走向衰退。如果 AI 的输入越来越多来自 AI 自身,我们面对的不只是技术退化,而是整个知识生态的多样性坍缩。

AI 时代,公司优势正在换地方

AI 不是让产品力、技术力、运营力消失,而是把它们重新洗牌。第一波看技术和运营,第二波才会重新考验新的产品力。

OpenClaw 差成这样,为什么还能火

OpenClaw 的火,不是因为体验好,而是因为它把 AI 从聊天框推向了能替人行动的 agent。体验差不是反例,而是一个更大的产品信号。

AI 是乙方,人类的新工作是当好甲方

AI 越强,人越不能只做"发一句 prompt 的甲方"。它更像一个高吞吐、低摩擦、可反复返工的乙方。甲方的新能力是四件事:讲清需求、写清验收、看懂过程证据、为结果负责。

Claude Design 不是设计工具,是所有岗位 Agent 化的样板

Claude Design 不是 Anthropic 跨界做了一个 Figma 竞品,它更像是把 Claude Code 那套工作架构,换了一个介质,搬到了视觉设计里。未来每个岗位都会长出自己的 agent 工作环境——今天是设计,明天是 PM、运营、销售、法务、财务、投研、客服、HR。

Skill 不值钱之后,什么开始值钱

Skill 作为产品会自我消解,作为接口会重新分配价值。真正要研究的不是 Skill 怎么赚钱,而是它把哪部分知识变便宜之后,哪部分能力开始变贵。

AI 味不是机器味,是平均值的味道

大家以为 AI 味只是几个口头禅。更本质的真相是:它太像一个被训练得很好的优等生,努力完整、努力礼貌、努力不犯错,却越来越像平均值。

AI 不是来替你查报表的

很多团队还在想着怎么把报表接给 Agent。我越来越觉得,这轮变化真正逼着企业重写的,不是数据入口,而是数据平台的判断力。

真正贵的不是 token,而是低质量编排

Claude 收紧第三方 Agent 接入,表面上像定价争议,实质上是在逼整个行业面对一个更大的问题:真正贵的不是模型,而是低质量编排造成的系统性浪费。

Pretext:当前端第一次把“文字”当成实时图形系统来控制

Pretext 不是一个普通的文字排版库,而是在浏览器里把“文本测量”从 DOM 回流里拆出来,变成可缓存、可编排、可实时重算的基础能力。它厉害的地方,不只是快,而是让文字第一次有机会像图形系统里的几何对象一样,被前端开发者直接操控。

Skill 不该越写越重

很多 Skill 最后都会从能力沉淀变成流程负担。真正该优化的,往往不是继续把 Skill 写厚,而是补齐 Harness、评测与 Knowhow。

为什么 SaaS 产品都要变成 CLI + Skill

从飞书、钉钉近期动作出发,拆解 SaaS 为什么会走向 CLI + Skill,以及传统数据分析平台和报表平台该如何跟上;同时明确反对 SaaS 厂商重度重做一个类似 Claw 的通用壳子。

你的公理系统

从 153 篇日记里提炼出的个人操作系统:不是你说过什么,而是你一直在做什么。

Harness Engineering 调研

把 OpenAI 的 harness engineering、Cursor 的 self-driving codebases 与 agent evals 串成一张图:agent-first 软件工程到底在搭什么底座。

先跑通,再变好:把不确定变成可迭代

很多问题不是"不会做",而是缺一个能跑通的最小闭环。先交付一个可演示版本,让系统开始产生反馈,迭代才有抓手。

展开阅读

我更相信「系统性推进」而不是「一次性完美」。当目标很大时,第一步的价值不是写出最正确的方案,而是做出一个可以运行的版本。

  • 把任务拆成 1–2 天可验证的小里程碑
  • 每个里程碑都有可视化产物(页面、截图、日志、链接)
  • 用"可演示"推动共识,而不是靠解释

跑通之后,再去优化体验、性能、结构。否则优化的是空气。

AI 不是一个功能,而是一条流水线

真正有价值的不是"问一句得到答案",而是把输入、约束、交付和复用串成一条可重复的流水线。

展开阅读

当你把 AI 当成产品的一部分,它就需要具备:

  1. 明确输入:上下文从哪里来?格式是什么?
  2. 明确输出:交付物是什么?给谁看?能否被复用?
  3. 明确质量门槛:失败怎么办?怎么回滚?

所以我更喜欢做"带流程的工具",而不是做"单点 demo"。

联系