被采访人的金句

  • 张亚勤:人工智能会沿着信息智能、物理智能、生物智能的图谱逐步实现 AGI。
  • 李想:把我当作一个 CEO 大模型来提问。
  • 刘先明:Language 是毒药。
  • 谭捷:Gemini Robotics 1.5 brings AI agents into the physical world。

内容提炼:五句话

  • 这几场访谈真正谈的不是“AI 能不能上车、上机器人”,而是 AI 一旦离开屏幕,原来的软件逻辑会失去哪一部分效力。
  • 张亚勤负责把时间轴摆出来,李想负责把终端系统想透,刘先明负责把旧方法拆掉,谭捷负责把前沿研究推进到物理世界。
  • 他们共同指出,语言模型只是起点,动作、环境反馈、跨本体迁移和世界模型才决定 AI 能不能长期工作。
  • 对车企和机器人公司来说,AI 竞争已经不是一个插件问题,而是一整套系统工程和组织工程。
  • 对软件行业来说,最大的变化是:很多过去只在界面里处理的问题,开始要用终端、传感器、时序和环境约束来重写。

对软件从业者为什么重要?

如果你只做屏幕里的软件,这一组访谈看上去可能离你很远。但它们真正提醒的是:AI 一旦从问答系统变成持续行动系统,软件定义就会跟着变。你写的不再只是一个把用户意图变成文本结果的产品,而是一套要面对噪声、延迟、权限、记忆和物理反馈的运行系统。

  • 你会发现“上下文”不再只是聊天记录,而开始包含位置、速度、摄像头、传感器和时间。
  • 你会发现“调用工具”不再只是 API 编排,而会变成调车、调机械臂、调环境、调安全策略。
  • 你会发现很多今天在网页里看上去成立的交互,一旦搬到车和机器人身上,立刻要补上稳定性、冗余和可解释性。

这也是为什么这组访谈对软件从业者很重要。它们逼着我们承认,AI 的下一层难度,不在聊天框里,而在系统怎样进入世界。

正文:张亚勤

张亚勤这场访谈像一张被缓缓展开的长地图。很多人谈 AGI,喜欢直接跳到终点,仿佛终点一到,其他问题都会自动解决。但他没有这样讲。他给出的不是一个神奇时刻,而是一条分段路线:信息智能先走,物理智能随后,生物智能最晚。这个顺序本身,就已经很有信息量了。

最能让人留下印象的例子,是他在节目里把未来几十年的 AGI 压缩成一组非常具体的刻度。信息智能在他那里更接近大脑的智商层,五年内有可能接近 AGI 水平;物理智能首先落地在自动驾驶,人形机器人大概要十年;生物智能则要到二十年量级,甚至会把寿命和物种边界一起改写。这个例子厉害的地方,在于他不是在描述一个抽象技术,而是在重新安排整个行业的时间感。

节目里还有一个更有画面的细节。他谈机器人分三类,家庭机器人、工厂机器人、社会机器人,然后顺着讲到人形机器人未来可能会成为每个人的一个 copy,一个分身。很多人听到这里会觉得太远,但正因为这个说法足够具体,它反而能让人一下子抓住他的思路:AI 最终不只是帮你回答问题,它会逐渐变成你的延伸体。

这个例子为什么有穿透力?因为它把很多今天混在一起说的话切开了。自动驾驶、人形机器人、生命延长、新物种,在日常讨论里经常被放成一个大包裹,好像都属于“未来科技”。张亚勤做的恰好相反。他给出了一张有节奏、有阶段、有载体变化的图谱。软件从业者听到这里,应该警觉到一件事:不同阶段的 AGI,需要的是完全不同的系统形态。

所以这场访谈最值得记住的,不只是乐观,而是这种乐观的结构感。它让物理世界里的 AI 不再只是一个模糊口号,而变成了一张有先后顺序的施工图。

正文:李想

李想第二次访谈最妙的地方,是它连访谈方式本身都像一场实验。张小珺在节目开头直接说,这次她把李想当成一个“CEO 大模型”来提问,前三个回合分别调用他的技术专家、战略专家、组织专家。很多访谈会把嘉宾当作一个完整人格去聊天,这次却像在解剖一个系统。

这就是最深的例子。它不是一句形容,而是整场访谈的结构。你会看到李想谈 MoE、谈 VLA、谈记忆、谈能量、谈对抗人性,这些主题在表面上看分散,但因为主持人先把他定义成一个“专家混合”的系统,整场谈话反而显得非常一致。它在问的始终是一个问题:如果一个 CEO 本身就是一套复杂系统,那么一家做 AI 的车企,会不会也必须像系统一样来理解?

这件事和他上一场关于理想同学、L4、硅基家人的访谈连起来看,就更完整了。第一次访谈里,李想更像在讲终端入口和长期关系;第二次里,他把视角收得更深,开始谈 CEO 怎样处理信息、组织怎样变成 MoE、汽车怎样成为智能体的现实载体。也就是说,他已经不满足于只把车看成智能硬件,而是在把车企整个组织都塞进了 AI 的问题里。

最有冲击力的地方在于,这个例子把“AI 公司”三个字重新解释了一遍。传统理解里,AI 公司可能是做模型、做算法、做助手的公司。李想给出的版本更重:AI 公司首先是一个持续学习、分工协作、能调不同专家解决复杂问题的组织体。车只是终端之一,L4 只是路径之一,真正重要的是系统如何长期吸收信息并持续行动。

所以第二次访谈里最值得记住的,不只是某一个技术观点,而是这场访谈本身已经像一个样机。它让读者看到,未来很多智能系统也许都要这样理解:不是一台机器,不是一个模型,而是一套会不断调用不同能力的混合体。

正文:刘先明

刘先明这场访谈最抓人的,不是他刚刚接任小鹏自动驾驶负责人这件事,而是他一上来就抛出了一句非常不舒服的话:Language 是毒药。对一个过去几年几乎把语言模型当作默认中心的行业来说,这句话带着一种切割感。

最深的例子,就在节目标题里已经提前写出来了:拆掉 L。这个动作之所以令人难忘,是因为它看起来像一个字母游戏,实则是一家车企对 AI 路径的公开修正。你原来以为大模型足够强,往自动驾驶里继续加语言能力就会更聪明;他现在却说,恰恰要对这个方向保持警惕,因为语言太强时,人会误以为系统已经懂世界了。

这件事在自动驾驶上尤其有代表性。车不是浏览器,世界也不会因为你语言流畅就自动让路。车面对的是连续感知、连续决策、连续动作,任何一环的幻觉都会迅速变成安全问题。也正因为这样,刘先明把“简单即美”拉了回来。这不是审美偏好,而是一种工程姿态:当系统进入物理世界,最先要追求的是稳定和闭环,而不是看起来更会说话。

这个例子之所以重要,还因为它来自一家正在 AI 转型的真实车企,而不是一个研究机构的白板推演。张小珺在节目介绍里点得很清楚,这是刘先明上任后首次接受专访,外界对他的好奇很大。于是这场访谈就有了额外的张力:它不是一个旁观者对行业的评论,而是一个正在承担结果的人,对技术路线做出的取舍。

所以刘先明这场访谈最值得软件从业者记住的,是这种“主动删掉一个最热词”的勇气。很多行业都习惯沿着最流行的名词往前滚,他却在说,进入物理世界以后,你得学会把看上去最先进的那一层先拿掉,看看系统还能不能站得住。

正文:谭捷

谭捷这场访谈有一种很特别的气质。它不像创业者对谈那样充满资源、竞争和窗口期,也不像车企访谈那样带着明确交付压力。它更像一扇研究前沿的窗口,让你看到 Google DeepMind 在怎样理解机器人、世界模型和跨本体迁移。

最能留下印象的例子,是节目标题里那组并列词:机器人、跨本体、世界模型、Gemini Robotics 1.5。它们合在一起,基本就把“AI 进入物理世界”这件事的难点全部点出来了。尤其是跨本体这个词,很值得记住,因为它意味着研究者已经不满足于让某一台机器人做成一个演示,而是在追问能力能不能跨不同身体、不同环境、不同任务去迁移。

节目介绍里有一句很关键的话:Gemini Robotics 1.5 brings AI agents into the physical world。这不是宣传语那么简单,它其实给出了前沿研究的重心变化。过去大家更关注模型在文本、图像、代码上有多强;到了机器人阶段,问题换成了模型如何理解空间、动作和反馈。也就是说,世界模型不再只是概念,而是要直接对接抓取、移动、碰撞、失败和重试。

这个例子最深的地方,在于它让“世界模型”脱离了行业黑话的状态。很多文章喜欢把世界模型当成下一代制高点来喊,但真正落到机器人领域,它的含义非常具体:系统能不能在没有完全相同训练样本的情况下,仍然对世界保持某种稳定的预期;能不能跨本体迁移;能不能在进入物理现场后不至于立刻失灵。

所以谭捷这场访谈提供的价值,是把屏幕里的 AI 研究重新钉回世界。你会突然意识到,很多今天在软件里看似成熟的能力,到了机器人身上还远未成熟。而这也正是下一轮竞争的刺激之处:AI 终于不只是在语言中证明自己,而开始要在世界里证明自己。