从向量库到 SAG:RAG 数据底座怎么演化
RAG 的核心问题已经从“怎么找相似文本”变成“怎么把证据、关系、事件和状态组织成可追溯的数据底座”。SAG 的价值不在 SQL 这个词,而在它用事件和实体绕开了重型全局知识图谱的维护成本。
- 原始文本、embedding、向量库和相似度搜索只是 RAG 的第一层,真正困难的是证据链和关系组织
在噪声、泡沫和模型幻觉之后,只保留有证据的 AI 变化。
固定入口先摆出来:HN、GitHub 热门仓库、论文和几条长期阅读路径。
按发布时间倒序,先看最新信号。
只放少量最近正文,完整列表进档案库。
RAG 的核心问题已经从“怎么找相似文本”变成“怎么把证据、关系、事件和状态组织成可追溯的数据底座”。SAG 的价值不在 SQL 这个词,而在它用事件和实体绕开了重型全局知识图谱的维护成本。
AI Agent 学习不要按中英文硬凑榜单。更有效的做法,是先用英文频道建立课程、工程现场、论文解读和人物访谈四层信息源,再用少量中文内容补背景和表达。
高考志愿、购物、投资、销售线索和咨询研究表面不同,底层都在做同一类事:围绕一个决策收集约束、连接多源信息、交叉验证、判断风险,并交付可执行结果。
当软件工程师和业务专家都熟练使用 Agent,差距会从写代码能力转向问题定义、系统拆解、结果验证,以及把一次成功沉淀成可复用能力的能力。这会改变两类人的优势排序。
按真实动作日期倒序,只看谁在做什么。
GitHub 在 6 月 19 日更新 Copilot usage metrics API,新增 `ai_credits_used` 字段,让企业和组织管理员能按用户查看每天消耗的 AI Credits。这个字段来自 usage-based billing API 使用的同一套消费数据,并能出现在 1 天和 28 天用户级报告里。结合 6 月 18 日 Copilot code review 支持仓库级 AGENTS.md、Copilot-authored PR 进入作者搜索,以及 GitHub Actions workflow execution protections 进入预览,GitHub 正在同时补成本、上下文和执行策略。
Microsoft Defender Security Research Team 在 6 月 18 日发布 AutoJack 研究,展示单个恶意网页如何借助 localhost 信任、缺失认证和不安全参数处理,把运行 AI browsing agent 的主机变成远程代码执行入口。文章以 AutoGen Studio 的 MCP WebSocket 为例,但真正指向的是更普遍的问题:当 Agent 同时能浏览不可信网页、访问本地服务并触发工具调用,传统的 localhost 边界就不再天然安全。
这条信号很重要,因为它把 Agent 安全从“提示词不要被注入”往下推进了一层。Agent 只要能接浏览器、本机服务和工具运行时,攻击面就会变成网页、端口、MCP、权限和参数校验的组合问题。后面企业评估 Agent,不会只问模型会不会拒答,还会问执行主机到底隔离到什么程度。
GitHub 在 6 月 18 日发布 actions/checkout v7,默认拒绝 pull_request_target 和部分 workflow_run 场景中常见的 fork PR 不安全 checkout 模式,并将在 7 月 16 日回溯到仍受支持的主版本。当天 GitHub 还预览了 workflow execution protections,允许企业、组织和仓库用 rulesets 控制谁可以触发 workflow、哪些事件可以触发 workflow,并明确把 Copilot、Dependabot 和 GitHub Apps 纳入 actor 规则。
这条更新不只属于 CI 安全,也和 Agent 落地直接相关。coding agent 会更频繁地产生 PR、触发检查、请求 review,执行链路如果继续靠每个 YAML 自觉,就很难承受自动化规模。GitHub 把 checkout 默认值和 workflow 触发策略往平台层收,是在给未来更多 Agent 参与代码库先补底板。
OpenAI 在 6 月 18 日发布 ChatGPT Enterprise 的新用量分析和 spend controls,面向组织管理员展示团队、工具和工作流层面的 AI 使用情况,并把预算、限额和异常消耗管理前移到企业控制台。这个动作和 GitHub 同日补 AI Credits 用户级 API 相互呼应:AI 不再只是席位订阅,而是需要可归因、可限额、可解释的组织工作负载。
这条值得放进玩家页,是因为企业 AI 的真实摩擦正在从“有没有模型”转向“谁用了、用在什么工作流、花了多少钱、有没有失控”。OpenAI 如果想让 ChatGPT Enterprise 和 Codex 继续进入大组织,就必须把成本治理做成默认能力,而不是让采购和财务事后对账。
GitHub 在 6 月 17 日发布 Agent finder for GitHub Copilot,让 Copilot 可以按任务从 MCP servers、skills、canvases、agents 和 tools 的索引里检索合适能力,并支持企业指定公共或私有 registry、用 managed settings 管控可发现资源。同一天,Copilot Chat 的 auto mode 面向所有用户可用,由系统按任务复杂度、模型可用性和策略自动选择模型,并给付费用户 10% 折扣。
这两条合在一起看,说明 coding agent 的管理面正在从“人手工挑模型、手工接工具”转向“平台按任务发现能力、按策略路由模型”。Agent 一多,真正消耗人的不是单次提示词,而是工具、模型、权限和上下文该怎么搭。GitHub 开始把这些选择产品化,是平台层继续变厚的信号。
OpenAI 在 6 月 17 日发布两条生命科学相关动作:一条展示 GPT-5.4 驱动的近自主 AI chemist 如何改进药物化学反应,另一条推出 LifeSciBench,用专家设计和专家复核的真实生命科学任务评估 AI 系统。两条合在一起看,OpenAI 不是只讲通用助手,而是在把模型、实验决策、领域评测和科研工作流连成更接近专业 Agent 的闭环。
这条信号的重点不是“AI 又能做科研”这种宽泛叙事,而是 OpenAI 开始同时补应用案例和评价尺子。专业 Agent 要进入医药和生命科学,不能只靠聊天能力,必须证明它能在真实任务里给出可复核的中间判断,并且有领域专家认可的评测框架。
周更判断,避免把单点消息拔成宏观趋势。
6 月中旬,GitHub 同时补 Copilot 用户级 AI Credits、AGENTS.md code review、workflow execution protections 和更安全的 Actions checkout;Microsoft 公开 AutoJack,说明浏览器 Agent 访问本机服务会把 localhost 变成攻击面;Bayer 与 Thoughtworks 的 PRINCE 案例则把状态持久化、失败恢复、引用、评测和监控写进生产级 Agentic RAG。三类信号共同说明,Agent 落地的竞争重点正在从“会不会完成任务”,转向“执行时是否可计量、可恢复、可阻断、可审计”。
6 月第一周,GitHub 把 Copilot 切到 AI Credits 并补 Automations、沙箱、Memory 和 Chronicle;AWS 把 AgentCore reasoning step 放进 Step Functions;Microsoft 在 Build 2026 强调 agentic enterprise 的上下文、平台和治理系统。这些动作共同说明,Agent 已经不再只是前台功能,而是需要运行时、预算、权限、审计和恢复机制的组织工作负载。
OpenAI 把 Codex 从 coding agent 扩到数据分析、销售、产品设计、投研和投行等角色插件;腾讯云发布覆盖办公、研发、创意、交互设计、文档和会议的效率智能体工具集;阿里千问开放第三方 Agent 和 Skill,让品牌服务进入 AI 应用入口。三类动作说明,Agent 竞争正在从“帮开发者写代码”扩到“帮不同角色完成一段工作”。
过去一周,OpenAI 把 Codex 放进企业 agentic coding 评价体系,Dropbox 公开 Nova 内部平台,GitHub 连续补 Copilot cloud agent 的 Actions 修复、review 反馈、REST API 和模型路由,Google 在 I/O 继续把 Gemini 放进开发者与搜索入口。这些动作共同说明,行业竞争正在从“谁更会写代码”转向“谁能把 agent 接进权限、沙箱、验证、审计和成本管理”。
轻量小游戏。
蓄力起跳,挑战更高分。
进入游戏轻解谜路线。
进入游戏自由探索式的宇宙小场景。
进入游戏五关渐进,边玩边猜。
进入游戏识图与判断结合的三连关。
进入游戏整站累计阅读 33,006 · 阅读计数汇总
GitHub 这轮最值得跟的,不是一个新按钮,而是管理面继续变厚。Agent 真正进组织后,管理员需要看到谁在用、花了多少、遵循哪份仓库指令、触发了哪些 workflow。Copilot 正在从编程助手变成组织里可计量、可配置、可追踪的工程工作负载。