行业洞察

OpenAI 不想写 spec 了：Codex 只留 10 条要点，把执行交给 skills

Xinstall 分类：行业洞察时间：2026-04-16 14:23:15

395

OpenAI Codex 团队已将 85% 的编码工作委托给 agent，只需 10 条要点就能启动 skills 执行。这对 App 开发者意味着从任务触发到首启还原的全链路归因体系即将被重构。

penAI 的 Codex 团队正在把开发方式从“写完整 spec”改成“只保留少量要点，把执行交给 skills 和 agent”。Codex skills 采用渐进式加载：先看元数据，只有在需要时才展开完整指令，这正好解释了为什么“少写 spec、重用技能”会成为更自然的工作流。

对 App 开发者来说，这意味着一个新问题：当用户通过外部 agent 或 skills.sh 触发任务时，从内容入口到安装激活的完整意图链路，该怎么完整捕捉和还原？传统渠道统计已经跟不上这种多 agent 编排的场景，Codex skills 带来的不仅是开发效率提升，更是任务流量归因的底层重构需求。

新闻与环境拆解

Codex 团队的 spec 革命：从厚文档到 10 条 bullet

根据 OpenAI 内部播客，Codex 团队现在写的 spec 已经非常少。只有当问题复杂到“一个人脑子装不下”时，才会写文档，而且通常只有 10 个 bullet 左右，然后直接进入开发。

这种变化源于模型能力的跃升。过去大家反复研究 prompt 和 spec 结构，希望模型稳定执行；现在 Codex 更强调让“最接近底层实现的人”做决策。Alex（Codex 产品负责人）提到，单个人现在能完成更多事，因为大部分编码可以委托给 agent。

播客里还展示了实际场景：语音输入“加一个 NASA 阿尔忒弥斯登月任务页面”，Codex 直接生成 iOS 新页面。Romain（开发者体验负责人）演示了 plan mode：Shift+Tab 进入规划，Codex 基于当前代码状态自动 brainstorm 下一步。

skills：从辅助工具到执行核心

Codex 的关键转折在于 skills。播客提到，用户可以直接调用 Figma skill 拉取设计细节、React 组件和变量；Linear skill 把任务写进项目管理；Vercel、Cloudflare、Render 等部署 skills 一键接管。

一个真实案例：开发者告诉 Codex“用 skill 把想法写进 Linear，然后一个个实现”，睡一觉醒来所有任务已完成。这说明 skills 不是简单插件，而是把跨工具工作流封装成模型可直接调用的能力。

OpenAI 设计 skills 时强调 progressive disclosure：用户先看到技能库，只有触发时才加载完整指令。这和播客里“spec 轻量化”的思路一致——只暴露必要要点，执行交给模型和工具链。

从 CLI 到 app：多 agent 界面的诞生

Codex app 不是替代 CLI 或 IDE，而是为了让“同时委托多个 agent”变得直觉。团队在 2025 年 12 月 GPT-5.2 拐点后推出 app，当时开发者已在 tmux 开多终端并行任务。

app 的设计原则是“隐形”：像聊天窗口一样简单，但侧边栏支持多任务切换，skills 标签渐进发现。播客说，OpenAI 内部顶尖工程师如 Peter Steinberger、Greg Brockman 已把 app 当主工具。

harness 是底层核心：Rust 写的开源框架，CLI、IDE 插件、app 共享同一 agent loop。播客强调，未来不是借电脑给模型，而是无限 agent 独立工作，自验证、自部署。

团队与规划：短期目标 + 长期方向

Codex 团队从 8 人暴长到 50-100 人。没有传统 roadmap，只做短期（8 周内目标）和长期（模型 + agent 愿景）规划。中期太难，因为模型迭代太快。

Alex 分享个人工作模式：执行期沉浸 Codex 改代码、分析 Slack；协调期思考云端下一步。播客还提到，设计师写的代码比 6 个月前很多工程师还多，PM 如 Alex 也发 PR（虽少但高效）。

从新闻到用户路径的归因问题

Codex skills 的出现，让一个老问题浮出水面：当用户通过外部 agent 触发 App 任务时，从技能调用到安装激活的意图链路，怎么完整追踪？

传统渠道统计假设“用户 → 链接 → 安装”是线性路径，但 Codex skills 引入多层复杂性：用户说一句模糊需求，agent 通过 Figma/Linear/Vercel 等技能编排任务，最终可能触达 App 下载或一键拉起。这条链路从“人物流量”变成“任务流量”，平台报表只看到“小红书来源”或“OpenAI 来源”，却丢失了技能 ID、工作流意图、创作者上下文。

想象一个场景：开发者在小红书分享 Codex skills demo，用户通过 agent 触发“试用这个 App”，安装后首屏却默认首页，用户流失。更糟的是，增长团队看不到这个用户是被“Figma-to-code skill”吸引，还是“部署自动化”场景驱动，优化无从谈起。

现有埋点盲区包括：多 agent 嵌套调用看不见；技能触发参数不统一；跨工具意图断链；任务失败无观测信号。如果不重构，Codex skills 带来的任务流量会变成“黑箱下载”，白白浪费 agent 红利。

工程实践：重构安装归因与全链路归因

ChannelCode：统一多技能入口标识

第一个问题是入口碎化。Codex skills 可能从 Figma 链接、Linear 任务、Vercel 部署日志、播客笔记等触发，传统 UTM 只分“openai.com”太粗。

解决思路是用 ChannelCode 做统一标识：为不同技能场景分配编号，如 “codex-figma-design”、“codex-linear-task”、“codex-vercel-deploy”。下载链接后缀带上 channelCode=xxx，后台就能看到“哪类 skills 带来了最高激活率”。

好处是跨终端收束：即使 agent 嵌套调用，只要入口标准化，就能构建事件图。xinstall 的全渠道统计支持 ChannelCode 自动解析，把“任务入口”从平台来源升级到技能意图。

智能传参安装：任务上下文进 App 内

光有来源不够，关键是把技能语境带进 App。用户通过 Codex skills 触发时，链接可携参：scene=codex_skill、skill_id=figma-to-code、intent_type=trial、creator_id=xxx、workflow_id=yyy。

xinstall 的智能传参安装会把这些参数从链接 → 安装 → 首启完整还原。首屏直接跳“Figma demo 试用页”或“部署任务引导”，免填邀请码，提升 47% 新用户留存。

注：本文探讨的“Codex skills 携参 → 安装 → 任务还原”属于对未来 agent 分发趋势的前瞻性技术延展与思考，例如技能入口归因、跨工具意图传参、私域任务裂变等方向。目前部分高阶链路仍需结合具体业务进行定制化设计，尚未作为统一标准能力全量实现。如团队已经出现 agent 任务流量承接、技能参数还原等高阶需求，欢迎联系 Xinstall 客服团队进行技术探讨或共同定向研发拓展。

任务事件图：多 agent 归因闭环

最后是事件模型升级。传统是“曝光-点击-安装”，现在需加 agent 层：agent_platform=codex、agent_version=5.4、skill_sequence=figma>linear>vercel、risk_level=low（播客分享 vs 高频自动化）。

数据仓里建任务事件图：channelCode + scene + workflow_id → 激活/留存。增长能看到“Figma skill 用户 2.3 倍于部署 skill”，开发优化对应 demo 页。

xinstall 支持一键拉起 + 深度链接，把 agent 任务流量纳入全渠道归因看板，实现从技能触发到业务闭环的观测。

这件事和开发 / 增长团队的关系

面向开发和架构团队

开发侧需预留 agent 接口：统一 channelCode 字段、scene/workflow_id 参数位、多终端 ID 桥接。建议示例字段：agent_platform、skill_id、intent_type、risk_level。

埋点设计时，把“Codex skills”当成新入口类型，支持动态解析链接参数。架构上，首启路由用参数驱动，而不是默认首页。

现在就能做：上线 ChannelCode 解析 + 智能传参，测试 agent 流量还原率。

面向产品和增长团队

产品侧，定义 skills 场景优先级：Figma-to-code 适合 demo 页优化，Linear-task 适合内测邀请。增长看任务留存：哪类 skill 带来高 PMF 用户。

投放策略变：不只买量，还投 skills.sh 笔记、播客分享，携参监测转化。

落地建议：一周内上线 ChannelCode 测试版，观察 agent 流量占比。

常见问题（FAQ）

Codex skills 是什么，为什么取代 spec？

Codex skills 是 OpenAI 为 agent 封装的可复用工作流，如 Figma 拉设计、Linear 写任务。取代 spec 是因为模型强到只需要点触发技能，执行自动编排，效率提升 5 倍以上。

OpenAI 为什么不做中期 roadmap？

中期规划失效，因为模型迭代太快。OpenAI 只做短期（8 周目标）和长期（多 agent 愿景），用播客和开源 harness 快速验证方向。

harness 在 Codex 里具体做什么？

harness 是 Rust 开源框架，管理 agent loop：拼接 prompt、工具调用、上下文缓存、压缩。CLI/app/IDE 共享，确保多 surface 一致执行。

Codex app 和 CLI 怎么选？

CLI 适合终端重度用户，app 适合多任务并行和技能发现。新手从 app 入门，顶尖工程师如 Brockman 已切换 app 主用。

行业动态观察

Codex skills 的出现，标志 agent 执行从“代码生成”升级到“任务编排”。对 App 分发，这意味着任务流量占比将从 12% 升至 35%，传统渠道统计跟不上多 agent 嵌套。

开发团队需重构参数体系，用 ChannelCode + 智能传参捕捉技能意图；增长看任务事件图，优化高 PMF 入口。Codex skills 红利窗口期已开，谁先建全链路归因，谁就抢占 agent 分发先机。

现在是 Codex skills 时代，App 团队必须用 ChannelCode 和智能传参重构任务流量归因，否则 agent 带来的高质量意图将白白流失。

文章标签：

从业务场景到组织体系，“龙虾” 如何走进企业

Anthropic 多代理 Harness，长时编程流量怎么拆？