当前位置：首页>工作报告>Codex报告:Agent 正在进入知识工作的深水区

Codex报告:Agent 正在进入知识工作的深水区

2026-06-16 21:30:35

我现在已经是个重度Agent用户，上个月我在Codex消耗了大约15亿的token，正好昨天（6月2号）OpenAI发布了Codex报告（The Next Era of Knowledge Work），我们讨论一下知识工作者该如何用Agent。

很多人对 Agent 的第一印象，会停留在“帮程序员写代码”，这不怪大家，无论是Claude Code还是Codex，他们的名字里就带着Code（编程），而且这轮Agent的主导技术就是Vibe Coding。

过去几年，AI 最容易被看见的能力，首先出现在代码场景里：补全函数、修 bug、生成脚本、跑测试、改项目文件。代码有明确结构，有可执行反馈，有相对清晰的对错边界，所以它天然适合成为 Agent 的早期试验场。

但 OpenAI 6 月 2 日发布的报告The Next Era of Knowledge Work提醒我们：Agent 的使用场景正在越过软件开发，进入更广泛的知识工作。

报告中的一句话很关键：Codex 已经不只是 coding tool（代码工具）。它正在帮助不同职业的人自动化日常工作、穿过现代知识工作的瓶颈，并把复杂任务组织成可交付的工作流。

这不是一个简单的“AI 提效”故事。更值得教育研究者和实践者注意的是：Agent 正在改变知识工作者和工具之间的关系。

一、知识工作缺乏通用工具

今天的知识工作者并不缺少软件。恰恰相反，我们的软件太多了：邮件、文档、表格、聊天记录、会议纪要、网盘、知识库、项目管理工具、学习管理系统。

每一个工具都解决了一个局部问题，却共同制造了一个更大的问题：工作信息被切碎了。我在不同的软件都创作或者收藏了很多有用的东西，但我该用的时候总是找不到。

报告把知识工作的日常成本概括为三类摩擦：

第一是搜索（search），也就是找到相关输入的成本。正确文件在哪里？哪份材料是最新版本？哪个数据表才可信？哪条消息里有关键决定？

第二是协调（coordination），也就是让信息和决定在不同人、不同工具、不同格式之间流动的成本。很多工作不是不会做，而是卡在转述、同步、等待、重排和对齐上。

第三是审批与验证（approval and verification），也就是让成果被接受、被检验、经得起现实检查的成本。工程里是测试、审查和部署；法律和咨询里是合伙人审核和客户接受；研究里是证据、复核和可辩护的推理。

这三个词很适合拿来解释今天很多教师、研究者和行政人员的疲惫。

我们可以自己写报告做表格，也并非反感开会，但我们为了完成这些工作，花了更多时间在找上下文、补材料、搬运格式、等待反馈、修订版本、确认责任。

知识工作变得更数字化了，却也更碎片化了。

二、为什么说Agent 是“知识工作的下一阶段”

一个普通聊天机器人可以回答问题、写一段话、给一个建议。但知识工作中的真实任务往往不是一个答案，而是一段流程：找材料、理解目标、调用工具、生成文件、检查错误、根据反馈修改、把结果交给下一个环节。

Codex报告里的一个关键比喻是：过去的办公软件降低了“生产文档、邮件、表格、PPT”的成本，但没有降低“理解、核验、协调、推进这些东西”的注意力成本。于是，邮件越方便，邮件越多；文档越容易写，版本越多；会议纪要越容易生成，真正需要判断的东西越容易淹没

OpenAI 想把 Codex 放在这个位置上：它不只是帮人写代码，而是帮人把一个问题拆成可执行任务，去找资料、写脚本、处理表格、生成报告、搭小工具、同时推进多个任务。OpenAI 官方页面称，Codex 已经有超过 500 万周活跃用户，自 2 月桌面应用发布以来增长超过 6 倍；知识工作者约占用户的 20%，增长速度超过开发者 3 倍。

报告里最有意思的数据是任务结构。知识工作者每周使用 Codex 时，72% 会生成某种“知识工件”，包括报告、备忘录、合同、图片、音频、视频、PDF 和电子表格；此外还有工程运维 47%、代码实现 46%、研究 41%。这说明边界正在模糊：开发者会让 Codex 写报告，非程序员也会让 Codex 写脚本、搭仪表盘、清洗数据。

当然，我们不需要了解这些增长数字，更有价值的是报告中的几个案例。

三、案例一：把分散公共信息变成可用的知识库

GroundVue 的案例很典型。

这家公司帮助政府机构相互学习，把公共会议变得可搜索、可比较。问题是，美国大约 9 万个政府机构的关键信息分散在视频、网页和地方平台中。过去，要找到并整理这些公共资料，需要大量技术人员和研究人员。

报告说，GroundVue 使用 Codex 寻找难以触达的公共来源，并建立持续收集、整理这些信息的系统。原来需要数天或数周的任务，现在可以压缩到数分钟。

这个案例的重点不是“AI 搜索更快”，而是 Agent 帮团队把碎片公共信息变成可用的 institutional knowledge。

对教育研究也一样。很多研究者最痛苦的不是没有资料，而是资料散落在政策文件、地方简报、学校案例、论文、会议纪要和个人笔记里。真正有价值的 AI 工作台，可以帮研究者把材料组织成可追溯、可比较、可更新的知识系统。

四、案例二：小团队把客户发现、方案设计和产品验证连起来

Proaction 是一个五人创业团队，帮助车队管理车辆和设备。它面对的客户问题很复杂：数据分散在远程信息系统、维护平台、电子表格和机构记忆中。

报告中的关键细节是：Proaction 的联合创始人 Colin Knudsen 用 Codex 把客户对话转化为定制方案、工作流原型和可运行 demo。也就是说，Agent 把 customer discovery、sales 和 product development 连接在一起。

这很像许多学校或教育机构的项目。

一个真实问题往往不会乖乖待在一个部门里。比如“减轻教师行政负担”既涉及流程，也涉及平台，也涉及评价，也涉及数据权限。过去，一线教师提出问题，管理者整理需求，技术团队排期开发，中间经过多轮转述，问题常常被改写得面目全非。

Agent 的潜力在于，它让最接近问题的人可以先做一个可运行原型：把对话整理成需求，把需求转成流程，把流程变成小工具，再用真实反馈修正它。

这不是取消专业分工，而是减少“问题到工具”之间的长距离转运。

五、案例三：大学教师把行政维护时间拿回来

报告里也有一个来自教育领域的案例，加州州立大学数学教授 Taiyo Inoue（井上太阳）介绍了自己的工作流。

他用 Codex 生成脚本，自动更新 Canvas 学习管理系统里的作业、日历、课程材料和通知。报告说，这个工作流每周为他节省大约 4 到 5 小时。

真正值得讲的不是“教授学会用Agent”，而是节省下来的时间去了哪里。

报告提到，Inoue 把这些时间重新投入课堂，把课程设计成更多面对面的协作问题解决活动。

这个案例特别适合提醒教育读者：AI 减负的意义，不是让教师继续接更多行政工作，而是把教师从低价值的管理维护中释放出来，重新靠近学生、问题和教学判断。

在教育场景里，Agent 最有价值的任务，可能并不是写一份漂亮教案，而是清理那些长期吞噬教师注意力的后台工作：同步课程表、整理材料版本、追踪学生提交、生成反馈记录、汇总家校沟通、维护平台信息。

如果这些工作被更好地代理，教师才可能把节省下来的时间投入真正需要人的地方。

六、我的尝试和反思

这份报告在提醒我们：Agent 正从程序员工具扩展为知识工作者的自我管理系统。

讲了三个别人的案例，我也讲个自己的案例吧。

我从2017年起养成了读电子书的习惯，我会在平台上划线以及写下自己的笔记。最近我发现，我已经积累了超过13000条笔记，于是我把这些笔记全部导出，在自己的电脑上做了个专门的项目文件，让Codex整理，并做了一套”李小祖逸.skill“。

这个很简单，微信读书和得到大脑这些平台都开源了自己的笔记.skill，仿照他们的模式很快帮你设计一个本地版。

现在我写东西，只要问：我有哪些笔记可以用到这篇文章？Agent就会告诉我我有哪些相关笔记，可以怎么用。

但我又开始反思另一些问题，我这个月用了15亿的token，这全是调用的GPT-5.5模型，其实成本很高的。

GPT告诉我，现在你的用量已经到了“小型工作室”的水平，已经进入了需要管理“算力资本”的阶段。

我开始想，我花了这么多的资源，有没有产出同等的价值呢？毕竟我是自费，得考虑这些成本和回报的问题。我可以试错，但我不能浪费；我可以消耗，但我应该要求自己有所产出。

于是我们形成了一套“吾日三省吾身（算力资本管理篇）”：

一省其耗：哪些 token 的花费无节制的浪费？

二省其试：哪些 token 的花费是有意义的试错？

三省其值：花掉这么多 token，是否创造了相称的价值？

余不一一

原报告链接：https://cdn.openai.com/pdf/the-next-era-of-knowledge-work.pdf

本文来自网友投稿或网络内容，如有侵犯您的权益请联系我们删除，联系邮箱：wyl860211@qq.com 。