AI 入口之争已经从“聊天窗口”升级为“持续运行的任务代理”,Search 正在变成最大众的 agent 分发层。
今日三条结论
2026 年算力需求没有见顶,反而因为推理、记忆和多步编排进入生产而继续上修。
企业真正愿意大规模付费的,不是会演示的 AI,而是能接流程、能治理、能验收、能稳定复用的 AI 系统。
今日 Top 5 大事件
1. Google 把 Search 明确推进到“AI 搜索框 + 后台信息代理 + 可生成 mini app”的新形态
这意味着搜索竞争的对象不再只是另一个搜索引擎,而是整个任务入口层。用户不只是在搜答案,而是在交付长期任务,例如持续追踪价格、房源、赛事、服务预约和个性化信息流。
查看完整拆解
Google 在 2026 年 5 月 19 日发布的 I/O 更新中,正式把 Search 描述为一个可以直接调用 agent 的系统,而不再只是结果页。核心变化包括:新的 AI Search box、Search agents、可持续后台监控的信息代理,以及基于 Antigravity 的定制化 dashboard 和 mini apps。Google 还披露,AI Mode 在上线一年后已超过 10 亿月活用户,且查询量按季度超过翻倍增长。Google Search
Google 在 2026 年 5 月 19 日发布的 I/O 更新中,正式把 Search 描述为一个可以直接调用 agent 的系统,而不再只是结果页。核心变化包括:新的 AI Search box、Search agents、可持续后台监控的信息代理,以及基于 Antigravity 的定制化 dashboard 和 mini apps。Google 还披露,AI Mode 在上线一年后已超过 10 亿月活用户,且查询量按季度超过翻倍增长。Google Search
2. NVIDIA 再次交出超预期季度,AI 基建仍在加速扩张
这组数据直接反驳了“AI 基建需求已经放缓”的判断。更关键的是,NVIDIA 把增长叙事从训练芯片延伸到了 agentic inference、AI factories、网络、边缘设备与推理软件栈,说明商业价值正在从“买 GPU”转向“买整套可运行的 AI 生产系统”。NVIDIA 财报
查看完整拆解
NVIDIA 于 2026 年 5 月 20 日公布 FY2027 第一财季业绩:季度收入 816 亿美元,同比增长 85%;数据中心收入 752 亿美元,同比增长 92%;下季度收入指引为 910 亿美元,上下浮动 2%。公司还新增 800 亿美元回购授权,并将季度股息从每股 0.01 美元提升到 0.25 美元。NVIDIA 财报
NVIDIA 于 2026 年 5 月 20 日公布 FY2027 第一财季业绩:季度收入 816 亿美元,同比增长 85%;数据中心收入 752 亿美元,同比增长 92%;下季度收入指引为 910 亿美元,上下浮动 2%。公司还新增 800 亿美元回购授权,并将季度股息从每股 0.01 美元提升到 0.25 美元。NVIDIA 财报
3. Microsoft 与 EY 把“从试点到生产”做成了可量化案例
这不是一次单点 demo,而是一组跨组织、跨流程、带治理与 ROI 指标的生产部署信号。市场讨论已从“员工会不会用 Copilot”转到“企业能不能把 agent 接进核心流程并持续证明收益”。
查看完整拆解
Microsoft 在 2026 年 5 月 21 日披露,与 EY 正共同投入超过 10 亿美元,推动企业从零散 AI 用例走向全公司级转型。公开数字包括:EY 早期已向 15 万员工部署 Microsoft 365 Copilot;当前正通过 Microsoft 365 E7 扩展到超过 40 万员工;多 agent 框架已部署到 13 万名 Assurance 专业人员和 16 万个审计项目中。微软还给出量化成效,包括财务运营 lead time 提速 95%、运营成本下降超 37%、税务文档自动化可将人工工作降低多达 90%。Microsoft
Microsoft 在 2026 年 5 月 21 日披露,与 EY 正共同投入超过 10 亿美元,推动企业从零散 AI 用例走向全公司级转型。公开数字包括:EY 早期已向 15 万员工部署 Microsoft 365 Copilot;当前正通过 Microsoft 365 E7 扩展到超过 40 万员工;多 agent 框架已部署到 13 万名 Assurance 专业人员和 16 万个审计项目中。微软还给出量化成效,包括财务运营 lead time 提速 95%、运营成本下降超 37%、税务文档自动化可将人工工作降低多达 90%。Microsoft
4. Anthropic 收购 Stainless,agent 竞争开始深入到 SDK 与 MCP 连接层
这不是普通的开发工具并购,而是平台层争夺。谁掌握更强的连接器生成、工具封装、接口维护与开发者体验,谁就更接近企业真实工作流。MCP 从协议概念进一步走向平台基础设施。
查看完整拆解
Anthropic 于 2026 年 5 月 18 日宣布收购 Stainless。Anthropic 的表述很直接:AI 的前沿正从“会回答的模型”转向“会行动的 agent”,而 agent 的能力边界取决于它能到达哪些系统。Stainless 的核心能力是将 API 规范生成 SDK、CLI 与 MCP servers,且其技术此前已支撑 Anthropic 官方 SDK 的生成。Anthropic
Anthropic 于 2026 年 5 月 18 日宣布收购 Stainless。Anthropic 的表述很直接:AI 的前沿正从“会回答的模型”转向“会行动的 agent”,而 agent 的能力边界取决于它能到达哪些系统。Stainless 的核心能力是将 API 规范生成 SDK、CLI 与 MCP servers,且其技术此前已支撑 Anthropic 官方 SDK 的生成。Anthropic
5. OpenAI 披露模型在离散几何中推翻长期猜想,科研型 AI 再往前走一步
这不是“帮人写证明”,而是被官方明确描述为通用推理模型在开放研究问题上给出原创性结果。更关键的是,外部数学家的评审意见表明,这一成果不只是在旧路线上堆算力,而是引入了来自代数数论的非显然思路。OpenAI
查看完整拆解
OpenAI 于 2026 年 5 月 20 日宣布,其内部通用推理模型在 unit distance problem 上推翻了一项自 1946 年以来广泛接受的主流猜想,并给出可构造的无限族改进;OpenAI 同时表示,该证明已由外部数学家核验。OpenAI
OpenAI 于 2026 年 5 月 20 日宣布,其内部通用推理模型在 unit distance problem 上推翻了一项自 1946 年以来广泛接受的主流猜想,并给出可构造的无限族改进;OpenAI 同时表示,该证明已由外部数学家核验。OpenAI
商业与应用解读
大模型公司:这一轮最值得注意的不是谁又刷新基准分,而是谁在抢控制权。Google 抢的是默认入口;Anthropic 抢的是连接层;Microsoft 抢的是企业控制面;OpenAI 抢的是高价值推理与研究心智;NVIDIA 则继续扮演全行业底层收费站。接下来大模型公司的估值解释,会越来越依赖“能否形成完整栈闭环”,而不是单点能力领先。Google Search Anthropic Microsoft OpenAI NVIDIA 财报
Agent / coding / workflow:Search、SDK、MCP、推理基础设施、审计流程,这些原本分散的层正在被 agent 串起来。真正的分水岭不是“会不会调用工具”,而是“能不能长期稳定地在真实系统里执行、被追责、被回滚、被迭代优化”。这也是为什么微软开始强调 execution,Anthropic 开始收连接器能力,NVIDIA 则把 agentic inference 直接写进财报主叙事。Microsoft Anthropic NVIDIA 财报
中国企业与内容服务场景:Google Search 的 agent 化,对中国市场的启发很直接。无论是品牌官网、电商货架、知识库、教育内容、旅行服务还是本地生活,下一步都要准备“给代理读和用”的信息资产,而不只是给人阅读的页面。SKU 属性、FAQ、时效信息、可追踪价格、库存与服务 API,都会比长篇文案更重要。
组织与治理:企业侧最稀缺的资源,正在从“试用账号数”变成“治理能力”。谁能把数据权限、人工介入、评测体系、日志、审计与责任边界做成基础设施,谁更容易把 AI 从试点拉到利润表。2026 年下半年,企业 AI 采购标准很可能继续从 seat-based 走向 workflow-based。 Microsoft
X 平台高信号观点
趋势信号:X 上围绕 Google I/O 2026 的讨论,核心焦点已经从“AI 回答好不好”转向“搜索流量会不会被 agent 入口重写”。
X 的 trending story 里,讨论明显集中在独立站流量承压、一次信息价值上升,以及“被 AI 读取”将比“被用户点击”更重要。验证状态:已被 Google 官方产品方向验证。X Trending Google Search
观点:企业 AI 的新瓶颈不是模型本身,而是 eval、反馈闭环与组织信任。
Applied Compute 在 X 上对 FDE 角色的描述,和微软公开的 EY 案例高度一致,说明一线部署者已经把重心放到“如何让 agent 在生产环境持续改进”上,而不是继续做演示型集成。验证状态:已被微软企业案例侧面验证。Applied Compute Microsoft
观点:agent 时代的界面设计仍然存在分叉,可能走向“替人做事”,也可能走向“增强人做事”。
Ethan Mollick 在 X 上提醒,AI 实验室现在更应该围绕“job augmentation through AI”而非“job replacement through AI”来设计界面;这对企业产品尤其关键,因为长期可接受的 agent 形态通常需要可见、可控、可接管。验证状态:属于观点,未被单一事实完全验证,但与当前企业部署方向一致。Ethan Mollick
前沿研究速递
1. CHI-Bench:把 agent 拉进高规则密度、长链条、不可逆的医疗运营流程
这篇 2026 年 5 月更新的论文提出 CHI-Bench,覆盖 prior authorization、utilization management 和 care management 三类医疗流程,并在包含 20 个 healthcare apps、87 个 MCP tools 的高保真模拟器中测试 agent。论文报告称,在 30 组 agent 配置中,最佳系统也只能解决 28.0% 的任务,严格口径下没有 agent 超过 20%。arXiv:2605.16679
2. FML-Bench:研究型 agent 的胜负,未必取决于更复杂的搜索策略
FML-Bench 研究 18 个基础机器学习研究任务、10 个领域,并把“agent 搜索策略”和“执行基础设施”分开评测。作者发现,一个简单的 greedy hill-climber 几乎能追平表现最好的 tree-search agent;进一步分析表明,当改进机会稠密时,贪心策略往往更有效,而当改进机会稀疏时,更广的探索才更占优。arXiv:2605.17373
3. Measuring Google AI Overviews:AI 搜索摘要正在重写信息分发与出版商收益逻辑
这项 2026 年 5 月研究对 55,393 个趋势查询做了纵向测量。作者发现:AIO 整体触发率为 13.7%,问题型查询升至 64.7%;近 30% 的 AIO 引用域名并未出现在同页自然结果中;拆分出的 98,020 个原子陈述里,有 11.0% 无法被引用页支持;超过一半被 AIO 引用的页面带有展示广告,这意味着 AIO 压低点击时,出版商的广告收益会受到直接影响。arXiv:2605.14021