AI 行业的主战场,正在从“模型能力竞赛”切换到“谁能占领真实工作系统”。
今日三条结论
安全评测、权限治理、来源引用与审计留痕,正在从配套能力变成主产品能力。
中国企业当前最值得投入的,不是继续围观模型大战,而是尽快把文档、表格、知识库和 SOP 改造成可控的 agent 工作流。
今日 Top 5 大事件
1. OpenAI 把 agent 安全从“提醒事项”推进成“工程栈”:收购 Promptfoo,并公开发布抵御 prompt injection 的设计方法
3 月 9 日,OpenAI 宣布将收购 AI 安全测试平台 Promptfoo;3 月 11 日,OpenAI 又发布了关于如何让 agents 抵御 prompt injection 的工程指南。
这说明头部模型公司已经不再把安全当作“上线前补一下”的检查项,而是在把它做成平台级能力。未来企业采购的重点,会从“哪个模型回答更聪明”转向“哪个 agent 系统更可测、更可控、更可追责”。
国内企业如果准备把 agent 接入知识库、浏览器、内部系统和审批流,现在就要把评测、日志、权限边界和注入防御一起纳入方案设计。没有这些能力,agent 更像 demo,而不是生产系统。
查看完整拆解
2. 微软发布 Frontier Suite,把 Copilot 从“助手”升级成企业 AI 操作栈
3 月 9 日,微软发布 Frontier Suite,并围绕 Microsoft 365 Copilot 推出更完整的 agent 能力、管理层和安全层组合。
这意味着企业 AI 竞争形态已经变化。下一阶段不是谁先加上聊天框,而是谁能把 AI 接进身份、权限、合规、知识和执行系统,形成真正可部署、可治理、可审计的组织级工作台。
对中国 SaaS、协同办公、企业服务厂商来说,单一 Copilot 已经不够。下一轮产品设计要围绕 agent 编排、统一管理台、审计轨迹和多模型路由来构建。
查看完整拆解
3. Google 持续把 Gemini 深嵌进 Workspace,AI 正在进入文档、表格、演示和知识库主工作流
3 月 10 日,Google 发布 Docs、Sheets、Slides 和 Drive 的一批新 Gemini 能力,首先向 Google AI Ultra 与 Pro 订阅用户开放。
企业里最真实、最频繁的工作,不发生在模型 playground,而发生在文档、表格、演示、邮件和共享盘。谁能把 AI 嵌进这些入口,谁就更接近高频生产行为和预算。
国内企业更值得关注“带权限的素材调用 + 引用可追溯 + 结果可复查”的 source-grounded workflow,而不是继续只比较对话效果。
查看完整拆解
4. Anthropic 成立 Anthropic Institute,把社会影响、法治与经济讨论前置成正式组织
3 月 11 日,Anthropic 宣布成立 Anthropic Institute,研究前沿 AI 对法治、经济活动和社会结构的影响,并同步扩充公共政策团队。
头部模型公司的竞争,正在从模型能力和商业化,进一步扩展到政策解释权、社会叙事权和治理框架制定权。谁先进入规则讨论桌,谁就更可能定义行业边界。
企业在制定 AI 战略时,不能只看产品能力,还要看模型提供方如何参与政策、劳动、法务与合规叙事。未来组织采购 AI,会越来越受这些外部治理框架影响。
查看完整拆解
5. OpenAI 推出 ChatGPT for Excel,AI 开始直接进入财务与运营表格层
OpenAI 发布了 ChatGPT for Excel,让用户可以在电子表格环境中直接调用 AI 进行分析、生成和辅助决策。
相比聊天机器人,表格场景离业务指标和经营动作更近,也更容易形成持续使用和明确 ROI。AI 进入 Excel,意味着它不再只是内容工具,而是逐步进入经营分析工具链。
企业可以优先把报表分析、预算测算、经营复盘、销售 pipeline 清洗等表格密集型工作交给 AI 辅助,这比从完全开放式的“通用写作”切入更容易证明价值。
查看完整拆解
商业与应用解读
过去一周最清晰的结论是:AI 已经不满足于做一个“回答问题的界面”,而是在进入组织的真实工作系统。微软把 Copilot 升级成工作系统级平台,Google 把 Gemini 放进文档、表格、演示和共享盘,OpenAI 则同时押注 Excel、Promptfoo 和 prompt injection 防御,说明头部厂商正在争夺同一件事:成为企业的 AI 操作层。
这件事会把产品竞争重心整体上移。上一阶段拼的是模型能力、上下文长度和 benchmark;下一阶段拼的是权限体系、评测框架、来源引用、日志留痕、可回滚性和跨工具工作流。真正可持续的企业 AI,不会是一个更聪明的聊天窗口,而是一个能在组织边界内稳定运行的 agent 系统。
对大模型公司来说,未来更值钱的是“工作流控制权”,而不是单次调用。谁能进入文档、表格、知识库、工单系统、客服流程、销售 pipeline 和经营分析界面,谁就离预算更近。对中国企业和内容服务场景来说,最现实的切入点也不是重新追一遍模型竞赛,而是优先改造四类高频流程:
- 报告、纪要、方案、周报这类文档密集流程
- 报表、预算、经营复盘、BI 辅助这类表格密集流程
- 售前、客服、投标、运营 SOP 这类 source-grounded 流程
- 研发、测试、排障、知识检索这类 agent 可编排流程
如果说 2025 年的关键词还是“给每个人加一个聊天框”,那么 2026 年更像是“给每个组织重做一遍工作操作系统”。