Freelemon

Post-AI Archive

AI Agent 废土档案站

在噪声、泡沫和模型幻觉之后，只保留有证据的 AI 变化。

8 最新更新 6 玩家动态 4 趋势雷达

01档案库 02幸存玩家 03辐射趋势

Signal Index

关键索引

固定入口先摆出来：HN、GitHub 热门仓库、论文和几条长期阅读路径。

最近 7 天 Hacker News AI 周精选 每周只挑 2 到 3 条真正值得写的 AI 相关讨论，再回到原始项目、产品页或官方文档核对。 入口：00｜本周 3 篇 Hacker News AI 文章先看哪一篇 最近 7 天 GitHub 热门仓库精选 寻找 GitHub 上最近变热的 AI repo，先看文档、代码入口、活跃度和可复现性，不把热榜截图当结论。 入口：00｜GitHub 精选：7 天快涨 repo 怎么看 最近 7 天 AI 论文精选 只跟最近 7 天真正值得继续跟进的 AI 论文，重点看问题定义、证据强度和代码入口，不做摘要搬运。 入口：00｜论文精选：最近 7 天的新论文该怎么挑 系统图谱 Agent 系列 从系统层、平台层、工具层到长时间 Agent，把基础版图先搭起来。 入口：长时间 AI Agent 生产架构蓝图 玩家底牌 公司小传 把 OpenAI、DeepMind、Anthropic、Microsoft、Meta 和 NVIDIA 放回各自产业路线里看。 入口：公司小传之六：NVIDIA 的 AI 底盘 组织变化 岗位重组认知系列 看程序员、产品、测试、架构、项目管理和 IT 在 Agent 时代怎么重新分工。 入口：AI 程序员面试答案：10 题评分点与识别信号

近期长文

只放少量最近正文，完整列表进档案库。

查看全部

AI Agent RAG 知识图谱

2026-06-29 07:28 北京时间 28 分钟

从向量库到 SAG：RAG 数据底座怎么演化

RAG 的核心问题已经从“怎么找相似文本”变成“怎么把证据、关系、事件和状态组织成可追溯的数据底座”。SAG 的价值不在 SQL 这个词，而在它用事件和实体绕开了重型全局知识图谱的维护成本。

阅读难度：硬核

原始文本、embedding、向量库和相似度搜索只是 RAG 的第一层，真正困难的是证据链和关系组织

阅读全文

AI Agent AI 编程行业观察

2026-06-21 05:22 北京时间 12 分钟

AI Agent 学习路线：哪些 YouTube 频道值得长期看

AI Agent 学习不要按中英文硬凑榜单。更有效的做法，是先用英文频道建立课程、工程现场、论文解读和人物访谈四层信息源，再用少量中文内容补背景和表达。

阅读难度：进阶

不要把中文前五和英文前五机械并列，AI Agent 的主信息流仍然在英文。

阅读全文

AI Agent AI 创业行业观察

2026-06-20 01:19 北京时间 13 分钟

泛数据分析应用会长在 Agent 底座上

高考志愿、购物、投资、销售线索和咨询研究表面不同，底层都在做同一类事：围绕一个决策收集约束、连接多源信息、交叉验证、判断风险，并交付可执行结果。

阅读难度：进阶

泛数据分析的核心，是把散落信息整理成可验证、可行动的决策。

阅读全文

AI Agent 软件工程技术沉思

2026-06-20 01:06 北京时间 11 分钟

会用 Agent 后，工程师和业务专家谁更强

当软件工程师和业务专家都熟练使用 Agent，差距会从写代码能力转向问题定义、系统拆解、结果验证，以及把一次成功沉淀成可复用能力的能力。这会改变两类人的优势排序。

阅读难度：进阶

业务专家赢在问题语义和验收判断，软件工程师赢在拆解、验证和系统化。

阅读全文

玩家

按真实动作日期倒序，只看谁在做什么。

查看全部

6月19日 GitHub

GitHub 把 Copilot AI Credits 用量细到用户级，继续补企业 Agent 的成本归因层

新闻原文

GitHub 在 6 月 19 日更新 Copilot usage metrics API，新增 `ai_credits_used` 字段，让企业和组织管理员能按用户查看每天消耗的 AI Credits。这个字段来自 usage-based billing API 使用的同一套消费数据，并能出现在 1 天和 28 天用户级报告里。结合 6 月 18 日 Copilot code review 支持仓库级 AGENTS.md、Copilot-authored PR 进入作者搜索，以及 GitHub Actions workflow execution protections 进入预览，GitHub 正在同时补成本、上下文和执行策略。

锐评

GitHub 这轮最值得跟的，不是一个新按钮，而是管理面继续变厚。Agent 真正进组织后，管理员需要看到谁在用、花了多少、遵循哪份仓库指令、触发了哪些 workflow。Copilot 正在从编程助手变成组织里可计量、可配置、可追踪的工程工作负载。

6月18日 Microsoft

Microsoft 公开 AutoJack，把浏览器 Agent 的本机执行风险推到安全议程前台

新闻原文

Microsoft Defender Security Research Team 在 6 月 18 日发布 AutoJack 研究，展示单个恶意网页如何借助 localhost 信任、缺失认证和不安全参数处理，把运行 AI browsing agent 的主机变成远程代码执行入口。文章以 AutoGen Studio 的 MCP WebSocket 为例，但真正指向的是更普遍的问题：当 Agent 同时能浏览不可信网页、访问本地服务并触发工具调用，传统的 localhost 边界就不再天然安全。

锐评

这条信号很重要，因为它把 Agent 安全从“提示词不要被注入”往下推进了一层。Agent 只要能接浏览器、本机服务和工具运行时，攻击面就会变成网页、端口、MCP、权限和参数校验的组合问题。后面企业评估 Agent，不会只问模型会不会拒答，还会问执行主机到底隔离到什么程度。

6月18日 GitHub

GitHub 让 Actions checkout 默认阻断常见 pwn request 模式，把 Agent 执行链路纳入供应链安全收口

新闻原文

GitHub 在 6 月 18 日发布 actions/checkout v7，默认拒绝 pull_request_target 和部分 workflow_run 场景中常见的 fork PR 不安全 checkout 模式，并将在 7 月 16 日回溯到仍受支持的主版本。当天 GitHub 还预览了 workflow execution protections，允许企业、组织和仓库用 rulesets 控制谁可以触发 workflow、哪些事件可以触发 workflow，并明确把 Copilot、Dependabot 和 GitHub Apps 纳入 actor 规则。

锐评

这条更新不只属于 CI 安全，也和 Agent 落地直接相关。coding agent 会更频繁地产生 PR、触发检查、请求 review，执行链路如果继续靠每个 YAML 自觉，就很难承受自动化规模。GitHub 把 checkout 默认值和 workflow 触发策略往平台层收，是在给未来更多 Agent 参与代码库先补底板。

6月18日 OpenAI

OpenAI 给 ChatGPT Enterprise 补用量分析和 spend controls，把企业 AI 成本治理推到产品层

新闻原文

OpenAI 在 6 月 18 日发布 ChatGPT Enterprise 的新用量分析和 spend controls，面向组织管理员展示团队、工具和工作流层面的 AI 使用情况，并把预算、限额和异常消耗管理前移到企业控制台。这个动作和 GitHub 同日补 AI Credits 用户级 API 相互呼应：AI 不再只是席位订阅，而是需要可归因、可限额、可解释的组织工作负载。

锐评

这条值得放进玩家页，是因为企业 AI 的真实摩擦正在从“有没有模型”转向“谁用了、用在什么工作流、花了多少钱、有没有失控”。OpenAI 如果想让 ChatGPT Enterprise 和 Codex 继续进入大组织，就必须把成本治理做成默认能力，而不是让采购和财务事后对账。

6月17日 GitHub

GitHub 发布 Agent finder 和 Copilot auto mode，把工具发现与模型路由产品化

新闻原文

GitHub 在 6 月 17 日发布 Agent finder for GitHub Copilot，让 Copilot 可以按任务从 MCP servers、skills、canvases、agents 和 tools 的索引里检索合适能力，并支持企业指定公共或私有 registry、用 managed settings 管控可发现资源。同一天，Copilot Chat 的 auto mode 面向所有用户可用，由系统按任务复杂度、模型可用性和策略自动选择模型，并给付费用户 10% 折扣。

锐评

这两条合在一起看，说明 coding agent 的管理面正在从“人手工挑模型、手工接工具”转向“平台按任务发现能力、按策略路由模型”。Agent 一多，真正消耗人的不是单次提示词，而是工具、模型、权限和上下文该怎么搭。GitHub 开始把这些选择产品化，是平台层继续变厚的信号。

6月17日 OpenAI

OpenAI 连发 AI chemist 和 LifeSciBench，把 Agent 能力往生命科学闭环任务里推进

新闻原文

OpenAI 在 6 月 17 日发布两条生命科学相关动作：一条展示 GPT-5.4 驱动的近自主 AI chemist 如何改进药物化学反应，另一条推出 LifeSciBench，用专家设计和专家复核的真实生命科学任务评估 AI 系统。两条合在一起看，OpenAI 不是只讲通用助手，而是在把模型、实验决策、领域评测和科研工作流连成更接近专业 Agent 的闭环。

锐评

这条信号的重点不是“AI 又能做科研”这种宽泛叙事，而是 OpenAI 开始同时补应用案例和评价尺子。专业 Agent 要进入医药和生命科学，不能只靠聊天能力，必须证明它能在真实任务里给出可复核的中间判断，并且有领域专家认可的评测框架。

Governance 2026-06-21

Agent 的执行边界正在从提示词护栏转向状态、策略和运行安全

6 月中旬，GitHub 同时补 Copilot 用户级 AI Credits、AGENTS.md code review、workflow execution protections 和更安全的 Actions checkout；Microsoft 公开 AutoJack，说明浏览器 Agent 访问本机服务会把 localhost 变成攻击面；Bayer 与 Thoughtworks 的 PRINCE 案例则把状态持久化、失败恢复、引用、评测和监控写进生产级 Agentic RAG。三类信号共同说明，Agent 落地的竞争重点正在从“会不会完成任务”，转向“执行时是否可计量、可恢复、可阻断、可审计”。

GitHub 的用户级用量、仓库指令、workflow actor / event 策略和 checkout 默认安全值，说明 coding agent 已经被当作组织执行主体来管理。

Microsoft Security Blog
AutoJack: How a single page can RCE the host running your AI agent

进入趋势页

Operations 2026-06-08

Agent 正在从功能入口变成要按工作负载治理的系统

6 月第一周，GitHub 把 Copilot 切到 AI Credits 并补 Automations、沙箱、Memory 和 Chronicle；AWS 把 AgentCore reasoning step 放进 Step Functions；Microsoft 在 Build 2026 强调 agentic enterprise 的上下文、平台和治理系统。这些动作共同说明，Agent 已经不再只是前台功能，而是需要运行时、预算、权限、审计和恢复机制的组织工作负载。

GitHub 的用量计费、自动化、沙箱和长期上下文，AWS 的 workflow reasoning step，微软的 Foundry 和 Agent 365，指向的都是“运行很多 agent”之后的治理问题。

GitHub
Updates to GitHub Copilot billing and plans

进入趋势页

Interface 2026-06-08

Agent 入口正在从开发者工具扩到角色化生产力工作流

OpenAI 把 Codex 从 coding agent 扩到数据分析、销售、产品设计、投研和投行等角色插件；腾讯云发布覆盖办公、研发、创意、交互设计、文档和会议的效率智能体工具集；阿里千问开放第三方 Agent 和 Skill，让品牌服务进入 AI 应用入口。三类动作说明，Agent 竞争正在从“帮开发者写代码”扩到“帮不同角色完成一段工作”。

OpenAI 走 role plugins 和 Sites，腾讯走多入口生产力工具集，阿里走第三方品牌 Agent 和 Skill，三者都在把 agent 包装成具体岗位和服务场景。

OpenAI
Codex for every role, tool, and workflow

进入趋势页

Infrastructure 2026-05-21

Coding Agent 的竞争焦点正在转向企业运行层

过去一周，OpenAI 把 Codex 放进企业 agentic coding 评价体系，Dropbox 公开 Nova 内部平台，GitHub 连续补 Copilot cloud agent 的 Actions 修复、review 反馈、REST API 和模型路由，Google 在 I/O 继续把 Gemini 放进开发者与搜索入口。这些动作共同说明，行业竞争正在从“谁更会写代码”转向“谁能把 agent 接进权限、沙箱、验证、审计和成本管理”。

企业真正放权给 coding agent 前，先要解决运行位置、权限边界、验证路径、失败回滚、成本归因和审计链路。

Dropbox
Introducing Nova: Our internal platform for coding agents

进入趋势页

小游戏

轻量小游戏。

经典

青蛙跳跳乐

蓄力起跳，挑战更高分。

进入游戏

解谜

霓虹回响

轻解谜路线。

进入游戏

探索

星尘漫游

自由探索式的宇宙小场景。

进入游戏

问答

元宵灯谜

五关渐进，边玩边猜。

进入游戏

判断

短剧猜猜猜

识图与判断结合的三连关。

进入游戏

整站累计阅读 33,006 · 阅读计数汇总