玩家 - Freelemon

6月19日 GitHub

GitHub 把 Copilot AI Credits 用量细到用户级，继续补企业 Agent 的成本归因层

新闻原文

GitHub 在 6 月 19 日更新 Copilot usage metrics API，新增 `ai_credits_used` 字段，让企业和组织管理员能按用户查看每天消耗的 AI Credits。这个字段来自 usage-based billing API 使用的同一套消费数据，并能出现在 1 天和 28 天用户级报告里。结合 6 月 18 日 Copilot code review 支持仓库级 AGENTS.md、Copilot-authored PR 进入作者搜索，以及 GitHub Actions workflow execution protections 进入预览，GitHub 正在同时补成本、上下文和执行策略。

锐评

GitHub 这轮最值得跟的，不是一个新按钮，而是管理面继续变厚。Agent 真正进组织后，管理员需要看到谁在用、花了多少、遵循哪份仓库指令、触发了哪些 workflow。Copilot 正在从编程助手变成组织里可计量、可配置、可追踪的工程工作负载。

6月18日 Microsoft

Microsoft 公开 AutoJack，把浏览器 Agent 的本机执行风险推到安全议程前台

新闻原文

Microsoft Defender Security Research Team 在 6 月 18 日发布 AutoJack 研究，展示单个恶意网页如何借助 localhost 信任、缺失认证和不安全参数处理，把运行 AI browsing agent 的主机变成远程代码执行入口。文章以 AutoGen Studio 的 MCP WebSocket 为例，但真正指向的是更普遍的问题：当 Agent 同时能浏览不可信网页、访问本地服务并触发工具调用，传统的 localhost 边界就不再天然安全。

锐评

这条信号很重要，因为它把 Agent 安全从“提示词不要被注入”往下推进了一层。Agent 只要能接浏览器、本机服务和工具运行时，攻击面就会变成网页、端口、MCP、权限和参数校验的组合问题。后面企业评估 Agent，不会只问模型会不会拒答，还会问执行主机到底隔离到什么程度。

6月18日 GitHub

GitHub 让 Actions checkout 默认阻断常见 pwn request 模式，把 Agent 执行链路纳入供应链安全收口

新闻原文

GitHub 在 6 月 18 日发布 actions/checkout v7，默认拒绝 pull_request_target 和部分 workflow_run 场景中常见的 fork PR 不安全 checkout 模式，并将在 7 月 16 日回溯到仍受支持的主版本。当天 GitHub 还预览了 workflow execution protections，允许企业、组织和仓库用 rulesets 控制谁可以触发 workflow、哪些事件可以触发 workflow，并明确把 Copilot、Dependabot 和 GitHub Apps 纳入 actor 规则。

锐评

这条更新不只属于 CI 安全，也和 Agent 落地直接相关。coding agent 会更频繁地产生 PR、触发检查、请求 review，执行链路如果继续靠每个 YAML 自觉，就很难承受自动化规模。GitHub 把 checkout 默认值和 workflow 触发策略往平台层收，是在给未来更多 Agent 参与代码库先补底板。

6月18日 OpenAI

OpenAI 给 ChatGPT Enterprise 补用量分析和 spend controls，把企业 AI 成本治理推到产品层

新闻原文

OpenAI 在 6 月 18 日发布 ChatGPT Enterprise 的新用量分析和 spend controls，面向组织管理员展示团队、工具和工作流层面的 AI 使用情况，并把预算、限额和异常消耗管理前移到企业控制台。这个动作和 GitHub 同日补 AI Credits 用户级 API 相互呼应：AI 不再只是席位订阅，而是需要可归因、可限额、可解释的组织工作负载。

锐评

这条值得放进玩家页，是因为企业 AI 的真实摩擦正在从“有没有模型”转向“谁用了、用在什么工作流、花了多少钱、有没有失控”。OpenAI 如果想让 ChatGPT Enterprise 和 Codex 继续进入大组织，就必须把成本治理做成默认能力，而不是让采购和财务事后对账。

6月17日 GitHub

GitHub 发布 Agent finder 和 Copilot auto mode，把工具发现与模型路由产品化

新闻原文

GitHub 在 6 月 17 日发布 Agent finder for GitHub Copilot，让 Copilot 可以按任务从 MCP servers、skills、canvases、agents 和 tools 的索引里检索合适能力，并支持企业指定公共或私有 registry、用 managed settings 管控可发现资源。同一天，Copilot Chat 的 auto mode 面向所有用户可用，由系统按任务复杂度、模型可用性和策略自动选择模型，并给付费用户 10% 折扣。

锐评

这两条合在一起看，说明 coding agent 的管理面正在从“人手工挑模型、手工接工具”转向“平台按任务发现能力、按策略路由模型”。Agent 一多，真正消耗人的不是单次提示词，而是工具、模型、权限和上下文该怎么搭。GitHub 开始把这些选择产品化，是平台层继续变厚的信号。

6月17日 OpenAI

OpenAI 连发 AI chemist 和 LifeSciBench，把 Agent 能力往生命科学闭环任务里推进

新闻原文

OpenAI 在 6 月 17 日发布两条生命科学相关动作：一条展示 GPT-5.4 驱动的近自主 AI chemist 如何改进药物化学反应，另一条推出 LifeSciBench，用专家设计和专家复核的真实生命科学任务评估 AI 系统。两条合在一起看，OpenAI 不是只讲通用助手，而是在把模型、实验决策、领域评测和科研工作流连成更接近专业 Agent 的闭环。

锐评

这条信号的重点不是“AI 又能做科研”这种宽泛叙事，而是 OpenAI 开始同时补应用案例和评价尺子。专业 Agent 要进入医药和生命科学，不能只靠聊天能力，必须证明它能在真实任务里给出可复核的中间判断，并且有领域专家认可的评测框架。

6月16日 Bayer / Thoughtworks

Bayer 与 Thoughtworks 公开 PRINCE 案例，把 Agentic RAG 写成可恢复、可观测、可评估的生产系统

新闻原文

Martin Fowler 网站在 6 月 16 日发布 Bayer 与 Thoughtworks 的 PRINCE 案例，介绍一个面向药物研发资料检索的生产级 agentic AI 系统。文章重点不在演示聊天能力，而是拆解 Agentic RAG、Text-to-SQL、状态持久化、失败恢复、LLM fallback、引用可解释性、数据集评测和 live traffic evaluation 等工程机制。

锐评

PRINCE 值得写进玩家页，是因为它把 Agent 从 demo 叙事拉回企业系统工程。长期任务、受监管领域和专业数据环境里，真正能落地的不是“一个会回答的模型”，而是有状态、有引用、有恢复点、有评测和人工复核的工作流。这个案例给的是生产系统的形状。

6月16日 OpenAI

OpenAI 发布 Deployment Simulation，把模型上线前行为预测从离线 benchmark 往真实对话回放推进

新闻原文

OpenAI 在 6 月 16 日介绍 Deployment Simulation，用真实对话数据模拟模型部署后的行为，提前预测新模型在上线环境里的安全和质量表现。相比只看静态 benchmark，这类方法更接近产品级 eval：它关心模型在真实用户分布、真实上下文和真实失败模式里的表现，而不是只在固定题库里得分。

锐评

Agent 产品越复杂，越不能只靠上线后人工巡检。Deployment Simulation 说明顶层玩家正在把 eval 前移到发布流程本身，用接近真实流量的方式预判风险。对所有做 Agent 的团队来说，这其实是一个门槛信号：没有部署前仿真，就很难管理长任务和工具调用里的连锁失败。

6月15日 GitHub

GitHub 让 Copilot usage metrics 覆盖更多活跃用户，继续把组织级 AI 使用面板补齐

新闻原文

GitHub 在 6 月 15 日更新 Copilot usage metrics，让指标覆盖更多 active users。这个动作夹在 6 月 11 日 AI usage report 更新和 6 月 19 日新增用户级 AI Credits 字段之间，说明 GitHub 正在持续修补企业管理员最需要的那层：哪些人真实使用 Copilot、哪些工作负载消耗最多、账单和行为数据能否对应起来。

锐评

这不是一个好看的 dashboard 小改版，而是 coding agent 进入组织后的基础设施。只要 Copilot 开始自动跑任务、生成 PR、触发 Actions，企业就不能只看席位数，而必须看真实活跃度、消耗归因和策略效果。GitHub 连续补 usage 数据，是在把 Copilot 从个人工具收口成企业工作负载。

6月14日 OpenAI

OpenAI 发布 Partner Network，把企业 AI 落地从直销产品扩成生态交付网络

新闻原文

OpenAI 在 6 月 14 日推出 OpenAI Partner Network，并表示投入 1.5 亿美元帮助全球合作伙伴加速企业 AI 采用、部署和转型。这个动作发生在 Codex 和 ChatGPT Enterprise 持续进入企业工作流之后，说明 OpenAI 正在承认一件现实：大组织的 AI 落地不只靠模型和界面，还要靠咨询、集成、迁移、安全和变更管理一起交付。

锐评

Partner Network 的意义在于，它把 OpenAI 从单一产品供应商往企业生态核心推进。Agent 真正落到组织里，会牵涉权限、数据、流程和岗位变化，靠一家模型公司自己交付不现实。谁能让合作伙伴围着自己的模型和工具做实施，谁就更容易成为企业 AI 项目的默认底座。

6月12日 GitHub / OpenAI

GitHub 给 Copilot code review 补配置控制，OpenAI 用 Academy 课程把 Agent 工作法产品化

新闻原文

GitHub 在 6 月 12 日发布 Copilot code review 的新 configurations and controls，让团队能更细地管理自动代码审查行为；同一天 OpenAI 发布 Academy 新课程，强调帮助用户建立可重复 AI workflow，并把 agents 应用到日常工作。一个补工程组织控制面，一个补普通知识工作者的使用路径，共同说明 Agent adoption 正在从“能不能用”转向“怎么被组织稳定地使用”。

锐评

这条合并看更有价值。Agent 不会因为模型强就自动进入日常流程，它需要配置、权限、课程、范式和管理语言。GitHub 负责把它嵌进代码评审，OpenAI 负责把它翻译成可学习的工作法，都是把 AI 从尝鲜工具变成组织习惯的铺路动作。

6月11日 GitHub

GitHub Agentic Workflows 进入公测，把自然语言自动化编译进 Actions

新闻原文

GitHub 在 6 月 11 日宣布 Agentic Workflows 进入 public preview。开发者可以用自然语言 Markdown 定义 issue triage、CI failure analysis、documentation updates 等推理型任务，系统再编译成标准 GitHub Actions YAML。官方同时强调，这些 workflow 复用既有 runner groups 和 policy constraints，agent 默认只读、在 sandboxed container 中执行，并配合 integrity filter、Agent Workflow Firewall、safe outputs 和 threat detection。

锐评

这条比单个 Copilot 功能更靠近生产系统。Agent 如果只能在聊天窗口里等人叫，它很难成为工程组织的常规劳动力；一旦能被编进 Actions，进入 runner、策略、审计和安全扫描，它就开始变成 CI/CD 里的正式工作单元。

6月11日 Meta / Manus

Meta 与中国背景 Agent 公司 Manus 的拆分进入执行阶段，Agent 资产跨境流动变成监管问题

新闻原文

Tom's Hardware 6 月 11 日援引 Bloomberg 报道称，Meta 已开始把中国背景的 Agent 公司 Manus 从内部系统中切开，员工被限制访问 Meta 内部数据系统，Meta 内部也停止使用 Manus 工具，并准备把既有 Manus 项目迁到 Meta 自有系统上。这个动作延续了中国监管部门要求撤回 Meta 收购 Manus 的压力，也让通用 Agent 公司第一次以如此具体的方式进入跨境技术资产和人才流动监管视野。

锐评

Manus 这条不是普通融资或并购八卦。Agent 公司一旦掌握产品、数据、自动化能力和人才组合，就会被监管视为技术资产，而不只是 SaaS 团队。对中国玩家来说，这意味着全球化路线不能只看产品增长，还要处理公司注册地、员工流动、IP 归属和监管可接受性。

6月11日 OpenAI

OpenAI 计划收购 Ona，为 Codex 补安全、持久的云端运行环境

新闻原文

OpenAI 在 6 月 11 日宣布计划收购 Ona，目标是扩展 Codex 的 secure, persistent cloud environments，让长时间 AI agents 可以跨企业工作流运行。这个动作和 Codex 从开发者工具扩向知识工作系统的方向一致：只要 Agent 要持续执行任务，就需要稳定环境、持久状态、权限边界和企业级安全，而不是每次临时启动一个上下文。

锐评

Ona 这条比普通并购更贴近 Agent 基建。Coding agent 的瓶颈不只是模型会不会写代码，而是能不能在云端保持工作现场、恢复上下文、隔离权限并承接长任务。OpenAI 如果要把 Codex 做成企业工作系统，持久运行环境是绕不过去的一层。

6月10日 AWS / GitHub / OpenAI

AWS 推 OpenSearch MCP Apps，GitHub 让 Copilot Chat 看见 agent sessions，Agent 调试开始进工作台

新闻原文

AWS 在 6 月 10 日发布 Amazon OpenSearch Service MCP Apps for agentic observability，让本地 AI agent 可以在 Claude Desktop、VS Code 等兼容 agentic IDE 里调查日志、trace、metrics 和 alerts，并返回可交互可视化。GitHub 同日发布 Copilot Chat now sees your agent sessions，OpenAI 也宣布 OpenAI models and Codex 可通过 Oracle cloud commitment 访问。几条动作都指向同一件事：Agent 的运行、观测和云端采购正在进入正式工作台。

锐评

这条值得写，因为 Agent 真正工作后，最难的不是开头生成，而是中途看见发生了什么。OpenSearch MCP Apps 把可观测性接进 Agent 对话，GitHub 把 session 历史接进 Copilot Chat，本质上都在给人类一个可追踪、可接管、可复盘的控制界面。

6月9日 GitHub / OpenAI

GitHub 做第三方 coding agent 安全验证，OpenAI 连发 Notion 和 Nextdoor Codex 案例

新闻原文

GitHub 在 6 月 9 日发布 Security validation for third-party coding agents，把第三方 coding agents 的安全验证纳入平台流程；同一天 OpenAI 发布 Notion 和 Nextdoor 使用 Codex 的案例，一个强调用 Codex one-shot specs 和构建 AI Voice Input，一个强调用 GPT-5.5 调查难复现问题并跨平台构建。安全验证和真实客户案例放在一起看，coding agent 正在同时进入平台治理和企业生产叙事。

锐评

这条很能说明 6 月后的节奏：一边是平台方开始验证第三方 agent 能不能安全进入代码库，一边是模型方用真实团队案例证明 Codex 不是 demo。Agent 生态如果继续扩大，入口方和模型方会同时争夺可信执行权：谁能证明安全，谁能证明产出。

6月5日腾讯云

腾讯云发布效率智能体工具集，把 WorkBuddy、CodeBuddy、文档和会议拉到同一张生产力地图里

新闻原文

腾讯云在 6 月 5 日发布效率智能体工具集，覆盖 WorkBuddy、CodeBuddy、Miora、Ardot、腾讯文档和腾讯会议等产品，并强调面向 20 多个垂直场景提供差异化 Agent 方案。对玩家层来说，这不是一个单点助手发布，而是腾讯把办公、研发、创意、交互设计、文档协作和会议上下文放到同一条 Agent 产品线上。

锐评

腾讯这步重要的地方，在于它没有只押一个万能 AI App，而是沿着用户每天已经打开的工作表面铺 Agent。WorkBuddy 抢办公，CodeBuddy 抢研发，文档和会议抢组织知识沉淀。真正值得跟的，是这些入口后续能否被统一身份、权限、上下文和任务流串起来。

6月5日华为云

华为云发布 Agentic AI 基础设施新品，把竞争焦点放到算力、记忆、调度和运行环境

新闻原文

华为云在 6 月 5 日 INSPIRE 创想者大会上发布 AICS 灵衢智算集群、AMS Agentic 记忆存储解决方案、CCE VolcanoNext 通智一体化调度和 AgentSphere 运行环境等 Agentic AI 新品。对玩家层来说，这条动作的重点不是多了一个前台助手，而是华为云把 Agent 视为一种需要专门基础设施承载的新工作负载。

锐评

这条信号补的是基础设施层。Agent 真正进入企业生产后，瓶颈不会只在模型，而会落到长任务状态、记忆存储、工具调度、资源利用率和运行隔离。华为云选择从算力和运行底座讲 Agentic AI，符合它的云和软硬协同优势。

6月3日 AWS

AWS 让 Step Functions 接入 AgentCore reasoning step，把 Agent 放进正式工作流状态机

新闻原文

AWS 在 6 月 3 日宣布 Step Functions 新增由 Amazon Bedrock AgentCore 支撑的 agentic reasoning step。开发者可以在状态机里加入 AI agent 推理步骤，顺序或并行运行多个 agent，插入人工审批，并在 workflow history 里查看输入、输出、token usage、duration 和 CloudWatch turn details。

锐评

AWS 这步很硬，因为它把 agent 从应用外部的聪明组件放进了企业已经在用的编排、重试、审批和审计系统。企业真正扩 agent，不会把所有流程搬到聊天界面里，而是会把 agent 作为一个可观察、可审批、可计费的 workflow step。

6月3日阿里

阿里千问开放第三方 Agent 和 Skill，开始把品牌服务接进 AI 应用入口

新闻原文

财新 6 月 3 日报道，阿里 AI 应用千问向第三方 Agent 和 Skill 开放，瑞幸、肯德基、东方航空等成为首批接入企业。企业可以在千问里接入 Skill，也可以运营品牌 Agent。这个动作紧接着 6 月 2 日 Qwen3.7-Plus 上线，后者强化了多模态、编程、Agent 和工具调用能力。

锐评

阿里这步的重要性在于，它把模型升级和应用生态开放连在一起。Qwen3.7-Plus 补执行底座，千问开放第三方服务补供给入口。国内 Agent 竞争如果进入品牌服务和交易场景，平台治理、服务质量和生态审核会变得和模型能力一样重要。

6月2日 OpenAI

OpenAI 把 Codex 从 coding agent 往知识工作系统扩，披露每周用户超过 500 万

新闻原文

OpenAI 在 6 月 2 日发布 Codex app 更新，称 Codex 每周用户已经超过 500 万，2 月桌面 app 发布后增长超过 6 倍，并特别强调约 20% 用户是知识工作者，增长快于开发者。新更新还加入面向数据分析、创意生产、销售、产品设计、公开股票投资和投行业务等角色的插件，并预览 Codex Sites、annotations 和更多工作流能力。

锐评

OpenAI 这步的重点，不是 Codex 又多会写一点代码，而是它在把“用代码完成工作”的能力推给非工程角色。只要报告、表格、演示、合同、数据分析和轻量工具都能由 Codex 交付，Codex 的竞争对象就不只是 IDE 插件，而是知识工作入口。

6月2日 GitHub

GitHub 一口气补 Copilot app、Automations、沙箱、Memory 和 Chronicle，把 coding agent 做成工作台系统

新闻原文

GitHub 在 6 月 2 日前后密集更新 Copilot：扩大 Copilot app 技术预览，推出 cloud agent automations，让 agent 可按日程或仓库事件自动运行；本地和云端沙箱进入 public preview；Copilot Memory 支持企业用户偏好；/chronicle 汇总跨 GitHub、IDE 和 app 的 agent session 历史。对玩家层来说，这不是一组零散功能，而是 GitHub 在把 Copilot 从 IDE 助手推成可运行、可记忆、可自动化、可治理的工作台系统。

锐评

GitHub 这轮最值得跟的，是它同时补前台和后台。App 抢工作台，Automations 抢长期维护任务，Sandboxes 抢执行安全，Memory 和 Chronicle 抢长期上下文。Coding agent 的竞争正在从“谁能改一段代码”转向“谁能管理一组持续工作的代理”。

6月2日 Microsoft

Microsoft Build 2026 把 agentic enterprise 讲成上下文、平台和治理系统

新闻原文

Microsoft 在 6 月 2 日 Build 2026 相关发布里，把 Microsoft IQ、Foundry、Copilot Studio、GitHub Copilot app、Agent 365 和多模型能力放进同一套 agentic enterprise 叙事。官方博客强调，真正改变企业的不是单个 AI，而是运行 AI 的系统。

锐评

微软这步重要的地方，不在单个 Copilot 名字，而在它试图把企业里的上下文、身份、数据、开发平台和第三方 agent 管理面连成系统。Agent 数量一旦增长，企业真正缺的就是“谁在运行什么、能访问什么、结果如何审计”的控制层。

6月1日 GitHub

GitHub Copilot 切到 AI Credits 和用量计费，把 agentic coding 的成本结构摆到台前

新闻原文

GitHub 在 6 月 1 日更新 Copilot billing and plans，把 premium request units 改为 GitHub AI Credits，并按 token usage 计费；GitHub Copilot code review 也开始消耗 AI Credits 和 GitHub Actions minutes。对玩家层来说，这不是一次普通价格表调整，而是 GitHub 承认多模型、多上下文、多小时云端 agent 任务不能再被粗糙订阅完全遮住。

锐评

这条信号的权重很高，因为它会改变开发者和企业采购对 coding agent 的看法。Agent 越像后台工作负载，越需要预算、限额、用量归因和成本解释。GitHub 先把账单结构改了，后续所有 AI 编程平台都要回答同一个问题：每一次代理工作到底值不值这笔推理钱。

5月23日 OpenAI

OpenAI 借 Gartner 评价把 Codex 推到企业 agentic coding 采购语境里

新闻原文

OpenAI 在 5 月 23 日发布 Gartner 2026 agentic coding 相关页面，把 Codex 放进企业 AI Coding Agents 的 Leader 叙事里。页面重点不再只是“帮工程师写代码”，而是把 Codex 描述成可以在组织内安全部署、规模化运行 agentic systems 的一部分。

锐评

这条动作的重要性不在 Gartner 标签本身，而在 OpenAI 正在把 Codex 从开发者工具继续推向企业采购、治理和平台对比语境。Coding agent 的竞争一旦进入 Magic Quadrant 这类企业评价体系，销售重点就会从模型能力转向安全、管理、部署和规模化案例。

5月21日 Dropbox

Dropbox 公开 Nova，把内部 coding agent 做成工程平台

新闻原文

Dropbox 在 5 月 21 日发布技术文章介绍 Nova，这是它面向内部 coding agents 的平台。Nova 的重点是让 agent 在云端运行，并接入 Dropbox 的 monorepo、Bazel、验证路径和自动化 workflow，而不是只做一个单点 IDE 插件。

锐评

Nova 是一个很硬的企业落地信号。大组织真正需要的不是又一个会补代码的助手，而是能读懂内部工程系统、跑对验证、遵守权限、把结果送进现有流程的平台层。Dropbox 选择自建 Nova，说明 coding agent 的核心工程量正在往运行层和内部平台迁移。

5月21日 Mozilla.ai

Mozilla.ai 发布 cq exchange，给 agents 做经验交换层

新闻原文

Mozilla.ai 在 5 月 21 日围绕 cq exchange 继续推进 agent 经验复用。cq exchange 提供私有 namespace 和 public commons，让 agents 可以保存、检索和复用经验型知识，减少反复踩同类错误。

锐评

这条信号补的是 agent 长期使用里的“经验层”。当 agent 不再只是一次性回答工具，它就需要知道哪些路径试过、哪些坑踩过、哪些知识可以共享。Mozilla.ai 把这件事产品化，说明记忆和经验复用正在从提示词技巧变成独立基础设施。

5月20日 Google

Google I/O 继续把 Gemini 推成搜索、开发和消费入口里的 agentic 底座

新闻原文

Google 在 5 月 20 日 I/O 2026 汇总里，把 Gemini 3.5 Flash、Antigravity、搜索里的 agent 能力和更多消费侧入口放进同一套叙事。Reuters 也把这次 I/O 的重点概括为 Google 继续把 AI agents 放进搜索框，并用更快、更便宜的 Gemini 争夺开发者和企业客户。

锐评

Google 这次不是只发一个模型，而是在同时抢搜索入口、开发者工具和消费侧默认位置。它的优势是分发面足够宽：搜索、浏览器、Android、Workspace、开发者 API 都能接 Gemini。真正值得跟的，是 Google 能不能把这些入口变成连续的 agent 工作流，而不是一堆分散功能。

5月19日 OpenAI

OpenAI 把 Codex 的回归 eval 单独给了预算

新闻原文

OpenAI 在最近的 developer 例会上把 Codex 系列的回归评测预算单独列了出来：算力额度和人工标注预算都从产品大盘里拆出，单独追踪。表面看是一个组织动作，实质是承认 agent 类产品的稳定性主要靠 eval 而非模型升级。

锐评

评估栈被升格成预算线，是 agent 类产品成熟度的一个早期信号。等上线规模再往上走，所有有规模运营的团队都会到这一步——区别只是早一年还是晚一年。

4月10日阿里巴巴

阿里认领 HappyHorse，视频模型竞争重新升温

新闻原文

4月10日，Caixin Global 报道 Alibaba 已确认此前匿名登顶 Artificial Analysis Video Arena 的 HappyHorse 归属阿里。HappyHorse 官网也写明，该模型来自 Alibaba 的 ATH AI Innovation Unit，目前已经在多项视频生成榜单拿到第一，并计划在 4 月 30 日开放 API。对玩家层来说，这不是一次普通模型曝光，而是阿里把一个已经被外部盲测验证过的视频模型正式推到台前。

锐评

这条信号的权重高，不在于又多了一个视频模型名字，而在于它同时具备外部排名验证、清晰团队归属和明确商业化时间表三个条件。相比再补一条 GitHub 小更新，HappyHorse 更能代表中国玩家在视频 agent 与多模态生产链上的实质推进。

玩家动态：谁在把 Agent 接进代码库、预算和平台底座？

GitHub 把 Copilot AI Credits 用量细到用户级，继续补企业 Agent 的成本归因层

Microsoft 公开 AutoJack，把浏览器 Agent 的本机执行风险推到安全议程前台

GitHub 让 Actions checkout 默认阻断常见 pwn request 模式，把 Agent 执行链路纳入供应链安全收口

OpenAI 给 ChatGPT Enterprise 补用量分析和 spend controls，把企业 AI 成本治理推到产品层

GitHub 发布 Agent finder 和 Copilot auto mode，把工具发现与模型路由产品化

OpenAI 连发 AI chemist 和 LifeSciBench，把 Agent 能力往生命科学闭环任务里推进

Bayer 与 Thoughtworks 公开 PRINCE 案例，把 Agentic RAG 写成可恢复、可观测、可评估的生产系统

OpenAI 发布 Deployment Simulation，把模型上线前行为预测从离线 benchmark 往真实对话回放推进

GitHub 让 Copilot usage metrics 覆盖更多活跃用户，继续把组织级 AI 使用面板补齐

OpenAI 发布 Partner Network，把企业 AI 落地从直销产品扩成生态交付网络

GitHub 给 Copilot code review 补配置控制，OpenAI 用 Academy 课程把 Agent 工作法产品化

GitHub Agentic Workflows 进入公测，把自然语言自动化编译进 Actions

Meta 与中国背景 Agent 公司 Manus 的拆分进入执行阶段，Agent 资产跨境流动变成监管问题

OpenAI 计划收购 Ona，为 Codex 补安全、持久的云端运行环境

AWS 推 OpenSearch MCP Apps，GitHub 让 Copilot Chat 看见 agent sessions，Agent 调试开始进工作台

GitHub 做第三方 coding agent 安全验证，OpenAI 连发 Notion 和 Nextdoor Codex 案例

腾讯云发布效率智能体工具集，把 WorkBuddy、CodeBuddy、文档和会议拉到同一张生产力地图里

华为云发布 Agentic AI 基础设施新品，把竞争焦点放到算力、记忆、调度和运行环境

AWS 让 Step Functions 接入 AgentCore reasoning step，把 Agent 放进正式工作流状态机

阿里千问开放第三方 Agent 和 Skill，开始把品牌服务接进 AI 应用入口

OpenAI 把 Codex 从 coding agent 往知识工作系统扩，披露每周用户超过 500 万

GitHub 一口气补 Copilot app、Automations、沙箱、Memory 和 Chronicle，把 coding agent 做成工作台系统

Microsoft Build 2026 把 agentic enterprise 讲成上下文、平台和治理系统

GitHub Copilot 切到 AI Credits 和用量计费，把 agentic coding 的成本结构摆到台前

OpenAI 借 Gartner 评价把 Codex 推到企业 agentic coding 采购语境里

Dropbox 公开 Nova，把内部 coding agent 做成工程平台

Mozilla.ai 发布 cq exchange，给 agents 做经验交换层

Google I/O 继续把 Gemini 推成搜索、开发和消费入口里的 agentic 底座

OpenAI 把 Codex 的回归 eval 单独给了预算

阿里认领 HappyHorse，视频模型竞争重新升温

来源