当 AI 离开聊天框：张小珺访谈里的机器人、汽车与物理世界

访谈机器人具身智能

Feature Essay

当 AI 离开聊天框：张小珺访谈里的机器人、汽车与物理世界

张小珺的 AI 访谈里，还有一条很容易被忽略的暗线：AI 正在离开聊天框，走进车、机器人和更复杂的物理环境。我把张亚勤、李想第二次访谈、刘先明、谭捷放在同一篇里看，因为他们谈的都不只是功能，而是 AI 何时开始拥有身体、环境和长期行动能力。

2026-03-19 19:48 北京时间 23 分钟阅读难度：入门张小珺 AI 访谈系列

👀 3 阅读 👍 0 点赞

被采访人的金句

张亚勤：人工智能会沿着信息智能、物理智能、生物智能的图谱逐步实现 AGI。
李想：把我当作一个 CEO 大模型来提问。
刘先明：Language 是毒药。
谭捷：Gemini Robotics 1.5 brings AI agents into the physical world。

内容提炼：五句话

这几场访谈真正谈的不是“AI 能不能上车、上机器人”，而是 AI 一旦离开屏幕，原来的软件逻辑会失去哪一部分效力。
张亚勤负责把时间轴摆出来，李想负责把终端系统想透，刘先明负责把旧方法拆掉，谭捷负责把前沿研究推进到物理世界。
他们共同指出，语言模型只是起点，动作、环境反馈、跨本体迁移和世界模型才决定 AI 能不能长期工作。
对车企和机器人公司来说，AI 竞争已经不是一个插件问题，而是一整套系统工程和组织工程。
对软件行业来说，最大的变化是：很多过去只在界面里处理的问题，开始要用终端、传感器、时序和环境约束来重写。

对软件从业者为什么重要？

如果你只做屏幕里的软件，这一组访谈看上去可能离你很远。但它们真正提醒的是：AI 一旦从问答系统变成持续行动系统，软件定义就会跟着变。你写的不再只是一个把用户意图变成文本结果的产品，而是一套要面对噪声、延迟、权限、记忆和物理反馈的运行系统。

你会发现“上下文”不再只是聊天记录，而开始包含位置、速度、摄像头、传感器和时间。
你会发现“调用工具”不再只是 API 编排，而会变成调车、调机械臂、调环境、调安全策略。
你会发现很多今天在网页里看上去成立的交互，一旦搬到车和机器人身上，立刻要补上稳定性、冗余和可解释性。

这也是为什么这组访谈对软件从业者很重要。它们逼着我们承认，AI 的下一层难度，不在聊天框里，而在系统怎样进入世界。

正文：张亚勤

张亚勤这场访谈像一张被缓缓展开的长地图。很多人谈 AGI，喜欢直接跳到终点，仿佛终点一到，其他问题都会自动解决。但他没有这样讲。他给出的不是一个神奇时刻，而是一条分段路线：信息智能先走，物理智能随后，生物智能最晚。这个顺序本身，就已经很有信息量了。

最能让人留下印象的例子，是他在节目里把未来几十年的 AGI 压缩成一组非常具体的刻度。信息智能在他那里更接近大脑的智商层，五年内有可能接近 AGI 水平；物理智能首先落地在自动驾驶，人形机器人大概要十年；生物智能则要到二十年量级，甚至会把寿命和物种边界一起改写。这个例子厉害的地方，在于他不是在描述一个抽象技术，而是在重新安排整个行业的时间感。

节目里还有一个更有画面的细节。他谈机器人分三类，家庭机器人、工厂机器人、社会机器人，然后顺着讲到人形机器人未来可能会成为每个人的一个 copy，一个分身。很多人听到这里会觉得太远，但正因为这个说法足够具体，它反而能让人一下子抓住他的思路：AI 最终不只是帮你回答问题，它会逐渐变成你的延伸体。

这个例子为什么有穿透力？因为它把很多今天混在一起说的话切开了。自动驾驶、人形机器人、生命延长、新物种，在日常讨论里经常被放成一个大包裹，好像都属于“未来科技”。张亚勤做的恰好相反。他给出了一张有节奏、有阶段、有载体变化的图谱。软件从业者听到这里，应该警觉到一件事：不同阶段的 AGI，需要的是完全不同的系统形态。

所以这场访谈最值得记住的，不只是乐观，而是这种乐观的结构感。它让物理世界里的 AI 不再只是一个模糊口号，而变成了一张有先后顺序的施工图。

正文：李想

李想第二次访谈最妙的地方，是它连访谈方式本身都像一场实验。张小珺在节目开头直接说，这次她把李想当成一个“CEO 大模型”来提问，前三个回合分别调用他的技术专家、战略专家、组织专家。很多访谈会把嘉宾当作一个完整人格去聊天，这次却像在解剖一个系统。

这就是最深的例子。它不是一句形容，而是整场访谈的结构。你会看到李想谈 MoE、谈 VLA、谈记忆、谈能量、谈对抗人性，这些主题在表面上看分散，但因为主持人先把他定义成一个“专家混合”的系统，整场谈话反而显得非常一致。它在问的始终是一个问题：如果一个 CEO 本身就是一套复杂系统，那么一家做 AI 的车企，会不会也必须像系统一样来理解？

这件事和他上一场关于理想同学、L4、硅基家人的访谈连起来看，就更完整了。第一次访谈里，李想更像在讲终端入口和长期关系；第二次里，他把视角收得更深，开始谈 CEO 怎样处理信息、组织怎样变成 MoE、汽车怎样成为智能体的现实载体。也就是说，他已经不满足于只把车看成智能硬件，而是在把车企整个组织都塞进了 AI 的问题里。

最有冲击力的地方在于，这个例子把“AI 公司”三个字重新解释了一遍。传统理解里，AI 公司可能是做模型、做算法、做助手的公司。李想给出的版本更重：AI 公司首先是一个持续学习、分工协作、能调不同专家解决复杂问题的组织体。车只是终端之一，L4 只是路径之一，真正重要的是系统如何长期吸收信息并持续行动。

所以第二次访谈里最值得记住的，不只是某一个技术观点，而是这场访谈本身已经像一个样机。它让读者看到，未来很多智能系统也许都要这样理解：不是一台机器，不是一个模型，而是一套会不断调用不同能力的混合体。

正文：刘先明

刘先明这场访谈最抓人的，不是他刚刚接任小鹏自动驾驶负责人这件事，而是他一上来就抛出了一句非常不舒服的话：Language 是毒药。对一个过去几年几乎把语言模型当作默认中心的行业来说，这句话带着一种切割感。

最深的例子，就在节目标题里已经提前写出来了：拆掉 L。这个动作之所以令人难忘，是因为它看起来像一个字母游戏，实则是一家车企对 AI 路径的公开修正。你原来以为大模型足够强，往自动驾驶里继续加语言能力就会更聪明；他现在却说，恰恰要对这个方向保持警惕，因为语言太强时，人会误以为系统已经懂世界了。

这件事在自动驾驶上尤其有代表性。车不是浏览器，世界也不会因为你语言流畅就自动让路。车面对的是连续感知、连续决策、连续动作，任何一环的幻觉都会迅速变成安全问题。也正因为这样，刘先明把“简单即美”拉了回来。这不是审美偏好，而是一种工程姿态：当系统进入物理世界，最先要追求的是稳定和闭环，而不是看起来更会说话。

这个例子之所以重要，还因为它来自一家正在 AI 转型的真实车企，而不是一个研究机构的白板推演。张小珺在节目介绍里点得很清楚，这是刘先明上任后首次接受专访，外界对他的好奇很大。于是这场访谈就有了额外的张力：它不是一个旁观者对行业的评论，而是一个正在承担结果的人，对技术路线做出的取舍。

所以刘先明这场访谈最值得软件从业者记住的，是这种“主动删掉一个最热词”的勇气。很多行业都习惯沿着最流行的名词往前滚，他却在说，进入物理世界以后，你得学会把看上去最先进的那一层先拿掉，看看系统还能不能站得住。

正文：谭捷

谭捷这场访谈有一种很特别的气质。它不像创业者对谈那样充满资源、竞争和窗口期，也不像车企访谈那样带着明确交付压力。它更像一扇研究前沿的窗口，让你看到 Google DeepMind 在怎样理解机器人、世界模型和跨本体迁移。

最能留下印象的例子，是节目标题里那组并列词：机器人、跨本体、世界模型、Gemini Robotics 1.5。它们合在一起，基本就把“AI 进入物理世界”这件事的难点全部点出来了。尤其是跨本体这个词，很值得记住，因为它意味着研究者已经不满足于让某一台机器人做成一个演示，而是在追问能力能不能跨不同身体、不同环境、不同任务去迁移。

节目介绍里有一句很关键的话：Gemini Robotics 1.5 brings AI agents into the physical world。这不是宣传语那么简单，它其实给出了前沿研究的重心变化。过去大家更关注模型在文本、图像、代码上有多强；到了机器人阶段，问题换成了模型如何理解空间、动作和反馈。也就是说，世界模型不再只是概念，而是要直接对接抓取、移动、碰撞、失败和重试。

这个例子最深的地方，在于它让“世界模型”脱离了行业黑话的状态。很多文章喜欢把世界模型当成下一代制高点来喊，但真正落到机器人领域，它的含义非常具体：系统能不能在没有完全相同训练样本的情况下，仍然对世界保持某种稳定的预期；能不能跨本体迁移；能不能在进入物理现场后不至于立刻失灵。

所以谭捷这场访谈提供的价值，是把屏幕里的 AI 研究重新钉回世界。你会突然意识到，很多今天在软件里看似成熟的能力，到了机器人身上还远未成熟。而这也正是下一轮竞争的刺激之处：AI 终于不只是在语言中证明自己，而开始要在世界里证明自己。

参考来源

这里只有一层：长文 - 评论。可以改昵称，也可以不改；改完之后会在这台设备上记住。

还没有评论，你可以写下第一条。

继续阅读

别把这篇当成终点。这里优先给你系列内延续、同主题扩展和站内值得继续看的文章。

继续读这个系列

这篇属于「张小珺 AI 访谈系列」，优先按系列顺序继续往下读。

2026-03-19 19:49 北京时间 24 分钟同属「张小珺 AI 访谈系列」

张小珺 AI 访谈的另一半：研究者、创业者与投资人的那张桌

如果前几篇写的是做模型的人和做 Agent 的人，这一篇写的是张小珺 AI 访谈里另一半更杂、更关键的角色：前沿研究者、垂类应用创业者、账上有钱却还在找方向的人，以及不断给行业泼冷水的投资人。

2026-03-19 22:14 北京时间 16 分钟同属「张小珺 AI 访谈系列」

张小珺技术解读地图：DeepSeek、Agent 与 VLA

如果前几篇张小珺系列文章是在看谁坐在哪张桌上，这一篇要解决的是另一件事：当你想补上她节目里最有价值的技术背景板，应该先听哪几期、按什么顺序、每一摞节目到底解决什么问题。

2026-03-19 22:14 北京时间 10 分钟同属「张小珺 AI 访谈系列」

张小珺 AI 访谈地图：这组文章最适合怎么读

这不是一篇普通目录，而是一张读法地图：张小珺的 AI 访谈已经足够多，真正重要的不是把所有标题抄一遍，而是先分清哪几张桌在说话，再决定自己该从哪里进入。

同主题延伸

如果你想顺着当前问题继续往下挖，这里优先给相近主题的文章。

2026-03-19 17:11 北京时间 24 分钟同主题：访谈

从张小珺的 AI 深访里，看见 Agent 时代真正的产品线索

把肖弘、明超平、李想这些访谈接起来看，2025 年之后真正的变化不是大家都在做 Agent，而是产品定义从“一个会回答的模型”变成“一个能嵌进环境、持续代办并承接信任关系的活系统”。

2026-03-19 17:10 北京时间 22 分钟同主题：访谈

从张小珺的 AI 深访里，看清中国大模型创业到底在争什么

把杨植麟、王小川、李开复几场最关键的对谈放在一起看，会发现中国大模型创业真正争的不是一时融资、榜单或估值，而是 AGI 北极星、技术与场景的咬合、推理成本和产品入口怎样同时成立。

2026-03-16 23:30 北京时间 18 分钟同主题：访谈

罗永浩对谈闫俊杰：MiniMax、模型竞争与中国 AI 的第三条路

这期对谈里，闫俊杰反复强调的不是某个模型又涨了多少分，而是中国 AI 公司必须在资源差距、产品定义和组织方法上同时找到自己的路：把模型当产品本体，坚持多模态和 AGI 方向，用第一性原理做技术判断，再把能力交还给更广泛的普通用户。

编辑精选

如果你想从这篇扩出去，这里放最近值得继续看的站内长文。

2026-03-19 17:14 北京时间 26 分钟编辑精选

下一篇 国内智能电车企业的 AI，已经开始分成四种做法

阅读难度

入门

概念为主，适合快速进入。

专题

张小珺 AI 访谈系列

这个系列使用显式顺序维护，不依赖发布时间改动来维持前后关系。

要点

张亚勤把 AGI 画成一张分阶段地图：先信息智能，再物理智能，最后才是生物智能，时间尺度和载体完全不同。
李想第二次访谈最打人的地方，是他把 CEO、汽车与智能体看成同一种系统工程，连访谈本身都被做成了 MoE 实验。
刘先明和谭捷共同说明，AI 一旦进入物理世界，语言不再足够，跨本体、动作和环境反馈才是主战场。

RSS

Subscribe to long-form updates through RSS. Feed timestamps use Beijing time.

Open RSS feed

LLMs

This site also exposes llms.txt and sitemap.xml for model-friendly discovery.

Open llms.txt

当 AI 离开聊天框：张小珺访谈里的机器人、汽车与物理世界

被采访人的金句

内容提炼：五句话

对软件从业者为什么重要？

正文：张亚勤

正文：李想

正文：刘先明

正文：谭捷

参考来源

评论（0）

继续阅读

继续读这个系列

张小珺 AI 访谈的另一半：研究者、创业者与投资人的那张桌

张小珺技术解读地图：DeepSeek、Agent 与 VLA

张小珺 AI 访谈地图：这组文章最适合怎么读

同主题延伸

从张小珺的 AI 深访里，看见 Agent 时代真正的产品线索

从张小珺的 AI 深访里，看清中国大模型创业到底在争什么

罗永浩对谈闫俊杰：MiniMax、模型竞争与中国 AI 的第三条路

编辑精选

国内智能电车企业的 AI，已经开始分成四种做法

中国大厂 AI 最近 70 天：入口、执行权与控制面的重新分配

黄仁勋 GTC 2026 演讲之后：谁会先被改变