
手机微信扫一扫联系客服
151OpenAI Codex总监Michael Bolin访谈,AI编码占比80-90%,但问题定义是新瓶颈。研发团队如何追踪Agent任务链路与协作归因?
当AI能写80%-90%的代码,工程师的核心从“写”转向“问对问题”,但Agent执行链路的追踪,却成了效率新杀手。
InfoQ翻译The Developing Dev播客,OpenAI Codex技术负责人Michael Bolin回顾20年工程实践,指出AI编程时代,提出正确问题比写代码更重要;Codex CLI/Web版迭代中,用户规模破百万,但本地 vs 云端部署引发新思考。AI 已能写 80% 代码,但 Agent 也有致命短板!OpenAI Codex 技术总监:问错了,比不会写更麻烦 SlopCodeBench研究证实,AI迭代代码易“结构侵蚀”与“冗余度”退化,人类维护代码质量更稳。
对App开发者,这意味着任务从人为转向Agent调度:谁发起、路径如何、效果归谁?
Codex负责人访谈+SlopCodeBench基准,揭示AI编程从“写”到“问”的范式转移。

Codex CLI开源获万星,Web版支持容器化开发;VS Code扩展迭代,GPT-5后增长陡峭。周活超百万,80-90%代码由模型生成,调试/重构/PR拆分全自动化。
Bolin强调云端部署主流:GitHub issue触发Agent处理,消费级规模远超企业内网。
SlopCodeBench测11模型,Claude Opus 4.6通过率仅17.2%;main()从84行胀1099行,圈复杂度285,9遍重复逻辑。开源仓库对比,AI“结构侵蚀”0.78,人类0.41。
“反slop”提示初始改善33%,但退化曲线平行,成本涨50%通过率反降。
Bolin从Google Calendar、Buck、Nucleide到Eden,强调“不满现状+快速原型”迭代;开源Buck获Uber/Airbnb采用,推动行业。
AI写代码快,但“问错”放大错误;Agent接issue、拆PR、跑CI,链路碎片:本地CLI触发云端Harness?VS Code扩展调用哪工具?迭代中参数丢了谁负责?
传统日志混杂,无法拆“人类手动 vs Agent任务”;多模型(GPT/Claude)协作,来源不明;云本地切换,事件断裂。
问题:CLI/Web/扩展多入口,任务源头不明。
做法:Harness层嵌入ChannelCode,标记Codex CLI/VS Code等。《亚马逊 AI 战略升级?多云多 Agent 时代 App 该怎么认清流量真身》
好处:看板拆“Codex任务流量”占比,优化云部署ROI。
问题:issue/PR参数复杂,跨工具丢“设计纪律”。
做法:DeepLink封装task_context、model_id,智能传参安装还原。《智能体分发时代 App 安装传参逻辑的底层重构》
好处:目标IDE启动续接,避免“越改越烂”。
问题:93检查点多轮,结构侵蚀无迹可循。
做法:Session ID追踪从“问”到“审”全链。
好处:可视“需求定义->Agent执行->PR审查”损耗点。
注:本文探讨的Agent研发链路归因属于前瞻延展。目前高度定制链路尚未标准实现,如有需求,欢迎联系 Xinstall 客服探讨研发。
面向开发 / 架构团队:
预留agent_platform、trace_id字段,支持云本地传参。测试Codex Harness兼容。
面向产品 / 增长团队:
Agent为新渠道,建立ChannelCode统计。定义“正确问题”入口,提升任务转化。
底层沙箱、系统细节手动;需求定义/PR审查/架构把控人类主导。
迭代“结构侵蚀”+“冗余度”退化;无长期设计纪律,短期最优导致烂尾。
本地限笔记本算力;云端接issue/PR/CD,规模百万用户。
“不满现状+原型验证”;选公司重视问题;开源招聘/贡献。
Codex/SlopCodeBench双视角,AI编程上半场“写快”,下半场“问对+链稳”。
App团队需任务归因穿越Agent黑箱,抢研发生态份额。
上一篇Xinstall深度解析:规避网络广告联盟利润黑盒漏洞
2026-05-15
短信到达率统计怎么做?营销短链追踪App唤醒防拦截闭环
2026-05-15
邮件打开率追踪怎么做?海外EDM推广引流App拉新与漏斗
2026-05-15
MiniMax推出Mavis?多Agent开始从“会分工”走向“会互相验收”
2026-05-15
中芯国际一季度营收增长8.1%?国产芯片景气修复仍在延续
2026-05-15
SpaceX招股书最早下周公布?全球流量将被一场超级IPO重新分配
2026-05-15
大数据分析平台怎么搭?Xinstall海量日志ETL处理实战
2026-05-14
微信活动统计怎么做?私域H5防封跳转与精准引流归因架构
2026-05-14
广告安全策略怎么制定?防底层数据篡改与加密传输接口
2026-05-14
Claude for Small Business来了?AI下沉加速,企业入口再分化
2026-05-14
可灵AI登顶42国App Store总榜?全球流量外溢,出海入口生变
2026-05-14
谷歌发布安卓 AI 系统:系统入口前移,分发格局开始改写?
2026-05-14
媒体作弊监控怎么防?净化广告投放对账流的实时核销方案
2026-05-13
百度搭子DuMate正式亮相?统一入口升温,Agent分发开始变天
2026-05-13
微信已读和访客功能“已焊死”?熟人社交边界收紧,私域规则不会变
2026-05-13