Post-AI Archive

AI Agent 废土档案站

在噪声、泡沫和模型幻觉之后,只保留有证据的 AI 变化。

8 最新更新 6 玩家动态 4 趋势雷达
Signal Index

关键索引

固定入口先摆出来:HN、GitHub 热门仓库、论文和几条长期阅读路径。

最新更新

按发布时间倒序,先看最新信号。

进入长文库

近期长文

只放少量最近正文,完整列表进档案库。

查看全部
2026-06-29 07:28 北京时间 28 分钟

从向量库到 SAG:RAG 数据底座怎么演化

RAG 的核心问题已经从“怎么找相似文本”变成“怎么把证据、关系、事件和状态组织成可追溯的数据底座”。SAG 的价值不在 SQL 这个词,而在它用事件和实体绕开了重型全局知识图谱的维护成本。

阅读难度:硬核
  • 原始文本、embedding、向量库和相似度搜索只是 RAG 的第一层,真正困难的是证据链和关系组织
阅读全文
2026-06-21 05:22 北京时间 12 分钟

AI Agent 学习路线:哪些 YouTube 频道值得长期看

AI Agent 学习不要按中英文硬凑榜单。更有效的做法,是先用英文频道建立课程、工程现场、论文解读和人物访谈四层信息源,再用少量中文内容补背景和表达。

阅读难度:进阶
  • 不要把中文前五和英文前五机械并列,AI Agent 的主信息流仍然在英文。
阅读全文
2026-06-20 01:19 北京时间 13 分钟

泛数据分析应用会长在 Agent 底座上

高考志愿、购物、投资、销售线索和咨询研究表面不同,底层都在做同一类事:围绕一个决策收集约束、连接多源信息、交叉验证、判断风险,并交付可执行结果。

阅读难度:进阶
  • 泛数据分析的核心,是把散落信息整理成可验证、可行动的决策。
阅读全文
2026-06-20 01:06 北京时间 11 分钟

会用 Agent 后,工程师和业务专家谁更强

当软件工程师和业务专家都熟练使用 Agent,差距会从写代码能力转向问题定义、系统拆解、结果验证,以及把一次成功沉淀成可复用能力的能力。这会改变两类人的优势排序。

阅读难度:进阶
  • 业务专家赢在问题语义和验收判断,软件工程师赢在拆解、验证和系统化。
阅读全文

玩家

按真实动作日期倒序,只看谁在做什么。

查看全部
6月19日 GitHub

GitHub 把 Copilot AI Credits 用量细到用户级,继续补企业 Agent 的成本归因层

新闻原文

GitHub 在 6 月 19 日更新 Copilot usage metrics API,新增 `ai_credits_used` 字段,让企业和组织管理员能按用户查看每天消耗的 AI Credits。这个字段来自 usage-based billing API 使用的同一套消费数据,并能出现在 1 天和 28 天用户级报告里。结合 6 月 18 日 Copilot code review 支持仓库级 AGENTS.md、Copilot-authored PR 进入作者搜索,以及 GitHub Actions workflow execution protections 进入预览,GitHub 正在同时补成本、上下文和执行策略。

锐评

GitHub 这轮最值得跟的,不是一个新按钮,而是管理面继续变厚。Agent 真正进组织后,管理员需要看到谁在用、花了多少、遵循哪份仓库指令、触发了哪些 workflow。Copilot 正在从编程助手变成组织里可计量、可配置、可追踪的工程工作负载。

6月18日 Microsoft

Microsoft 公开 AutoJack,把浏览器 Agent 的本机执行风险推到安全议程前台

新闻原文

Microsoft Defender Security Research Team 在 6 月 18 日发布 AutoJack 研究,展示单个恶意网页如何借助 localhost 信任、缺失认证和不安全参数处理,把运行 AI browsing agent 的主机变成远程代码执行入口。文章以 AutoGen Studio 的 MCP WebSocket 为例,但真正指向的是更普遍的问题:当 Agent 同时能浏览不可信网页、访问本地服务并触发工具调用,传统的 localhost 边界就不再天然安全。

锐评

这条信号很重要,因为它把 Agent 安全从“提示词不要被注入”往下推进了一层。Agent 只要能接浏览器、本机服务和工具运行时,攻击面就会变成网页、端口、MCP、权限和参数校验的组合问题。后面企业评估 Agent,不会只问模型会不会拒答,还会问执行主机到底隔离到什么程度。

6月18日 GitHub

GitHub 让 Actions checkout 默认阻断常见 pwn request 模式,把 Agent 执行链路纳入供应链安全收口

新闻原文

GitHub 在 6 月 18 日发布 actions/checkout v7,默认拒绝 pull_request_target 和部分 workflow_run 场景中常见的 fork PR 不安全 checkout 模式,并将在 7 月 16 日回溯到仍受支持的主版本。当天 GitHub 还预览了 workflow execution protections,允许企业、组织和仓库用 rulesets 控制谁可以触发 workflow、哪些事件可以触发 workflow,并明确把 Copilot、Dependabot 和 GitHub Apps 纳入 actor 规则。

锐评

这条更新不只属于 CI 安全,也和 Agent 落地直接相关。coding agent 会更频繁地产生 PR、触发检查、请求 review,执行链路如果继续靠每个 YAML 自觉,就很难承受自动化规模。GitHub 把 checkout 默认值和 workflow 触发策略往平台层收,是在给未来更多 Agent 参与代码库先补底板。

6月18日 OpenAI

OpenAI 给 ChatGPT Enterprise 补用量分析和 spend controls,把企业 AI 成本治理推到产品层

新闻原文

OpenAI 在 6 月 18 日发布 ChatGPT Enterprise 的新用量分析和 spend controls,面向组织管理员展示团队、工具和工作流层面的 AI 使用情况,并把预算、限额和异常消耗管理前移到企业控制台。这个动作和 GitHub 同日补 AI Credits 用户级 API 相互呼应:AI 不再只是席位订阅,而是需要可归因、可限额、可解释的组织工作负载。

锐评

这条值得放进玩家页,是因为企业 AI 的真实摩擦正在从“有没有模型”转向“谁用了、用在什么工作流、花了多少钱、有没有失控”。OpenAI 如果想让 ChatGPT Enterprise 和 Codex 继续进入大组织,就必须把成本治理做成默认能力,而不是让采购和财务事后对账。

6月17日 GitHub

GitHub 发布 Agent finder 和 Copilot auto mode,把工具发现与模型路由产品化

新闻原文

GitHub 在 6 月 17 日发布 Agent finder for GitHub Copilot,让 Copilot 可以按任务从 MCP servers、skills、canvases、agents 和 tools 的索引里检索合适能力,并支持企业指定公共或私有 registry、用 managed settings 管控可发现资源。同一天,Copilot Chat 的 auto mode 面向所有用户可用,由系统按任务复杂度、模型可用性和策略自动选择模型,并给付费用户 10% 折扣。

锐评

这两条合在一起看,说明 coding agent 的管理面正在从“人手工挑模型、手工接工具”转向“平台按任务发现能力、按策略路由模型”。Agent 一多,真正消耗人的不是单次提示词,而是工具、模型、权限和上下文该怎么搭。GitHub 开始把这些选择产品化,是平台层继续变厚的信号。

6月17日 OpenAI

OpenAI 连发 AI chemist 和 LifeSciBench,把 Agent 能力往生命科学闭环任务里推进

新闻原文

OpenAI 在 6 月 17 日发布两条生命科学相关动作:一条展示 GPT-5.4 驱动的近自主 AI chemist 如何改进药物化学反应,另一条推出 LifeSciBench,用专家设计和专家复核的真实生命科学任务评估 AI 系统。两条合在一起看,OpenAI 不是只讲通用助手,而是在把模型、实验决策、领域评测和科研工作流连成更接近专业 Agent 的闭环。

锐评

这条信号的重点不是“AI 又能做科研”这种宽泛叙事,而是 OpenAI 开始同时补应用案例和评价尺子。专业 Agent 要进入医药和生命科学,不能只靠聊天能力,必须证明它能在真实任务里给出可复核的中间判断,并且有领域专家认可的评测框架。

Governance 2026-06-21

Agent 的执行边界正在从提示词护栏转向状态、策略和运行安全

6 月中旬,GitHub 同时补 Copilot 用户级 AI Credits、AGENTS.md code review、workflow execution protections 和更安全的 Actions checkout;Microsoft 公开 AutoJack,说明浏览器 Agent 访问本机服务会把 localhost 变成攻击面;Bayer 与 Thoughtworks 的 PRINCE 案例则把状态持久化、失败恢复、引用、评测和监控写进生产级 Agentic RAG。三类信号共同说明,Agent 落地的竞争重点正在从“会不会完成任务”,转向“执行时是否可计量、可恢复、可阻断、可审计”。

  • GitHub 的用户级用量、仓库指令、workflow actor / event 策略和 checkout 默认安全值,说明 coding agent 已经被当作组织执行主体来管理。
Microsoft Security Blog
AutoJack: How a single page can RCE the host running your AI agent
进入趋势页
Operations 2026-06-08

Agent 正在从功能入口变成要按工作负载治理的系统

6 月第一周,GitHub 把 Copilot 切到 AI Credits 并补 Automations、沙箱、Memory 和 Chronicle;AWS 把 AgentCore reasoning step 放进 Step Functions;Microsoft 在 Build 2026 强调 agentic enterprise 的上下文、平台和治理系统。这些动作共同说明,Agent 已经不再只是前台功能,而是需要运行时、预算、权限、审计和恢复机制的组织工作负载。

  • GitHub 的用量计费、自动化、沙箱和长期上下文,AWS 的 workflow reasoning step,微软的 Foundry 和 Agent 365,指向的都是“运行很多 agent”之后的治理问题。
GitHub
Updates to GitHub Copilot billing and plans
进入趋势页
Interface 2026-06-08

Agent 入口正在从开发者工具扩到角色化生产力工作流

OpenAI 把 Codex 从 coding agent 扩到数据分析、销售、产品设计、投研和投行等角色插件;腾讯云发布覆盖办公、研发、创意、交互设计、文档和会议的效率智能体工具集;阿里千问开放第三方 Agent 和 Skill,让品牌服务进入 AI 应用入口。三类动作说明,Agent 竞争正在从“帮开发者写代码”扩到“帮不同角色完成一段工作”。

  • OpenAI 走 role plugins 和 Sites,腾讯走多入口生产力工具集,阿里走第三方品牌 Agent 和 Skill,三者都在把 agent 包装成具体岗位和服务场景。
OpenAI
Codex for every role, tool, and workflow
进入趋势页
Infrastructure 2026-05-21

Coding Agent 的竞争焦点正在转向企业运行层

过去一周,OpenAI 把 Codex 放进企业 agentic coding 评价体系,Dropbox 公开 Nova 内部平台,GitHub 连续补 Copilot cloud agent 的 Actions 修复、review 反馈、REST API 和模型路由,Google 在 I/O 继续把 Gemini 放进开发者与搜索入口。这些动作共同说明,行业竞争正在从“谁更会写代码”转向“谁能把 agent 接进权限、沙箱、验证、审计和成本管理”。

  • 企业真正放权给 coding agent 前,先要解决运行位置、权限边界、验证路径、失败回滚、成本归因和审计链路。
Dropbox
Introducing Nova: Our internal platform for coding agents
进入趋势页

小游戏

轻量小游戏。

经典

青蛙跳跳乐

蓄力起跳,挑战更高分。

进入游戏
探索

星尘漫游

自由探索式的宇宙小场景。

进入游戏
问答

元宵灯谜

五关渐进,边玩边猜。

进入游戏
判断

短剧猜猜猜

识图与判断结合的三连关。

进入游戏

整站累计阅读 32,959 · 阅读计数汇总