晚点聊 LateTalk
【具身季报 26Q2】世界模型大风不停,和不想被贴标签的人
「人形马拉松、Figure AI 直播、中国灵巧手亮相 ICRA、英伟达Cosomos3 & 世界模型投资热、Generalist 和 Pi 的模型进展。」
这期是《晚点聊》「具身季报」系列第二期,我继续邀请风投机构 Alphaist 的创始合伙人陈哲,来和我们分享最新的具身智能动态和趋势。
本期节目也会在 Alphaist 的播客《The Alphaist》 串台播出。
本期季报,依然按 TOP 5 进展和事件展开,包括:
人形机器人马拉松:荣耀夺冠的更多意味 Figure 的 200 小时直播:物流为什么是人形机器人好场景? 灵巧手和灵巧操作:谁是手中 G1? 英伟达的世界模型 Cosmos 3 和世界模型创投热 全球领先的具身模型进展: GEN-1 和 π 0.7。我们也延展讨论了一些资本市场的变化、新玩家进入——OpenAI 的 Robotics team 官宣——和行业落地 vs 推进智能的节奏与取舍。
图注:英伟达对“robotics”领域世界模型的分类。
图注:Figure AI 直播截图,机器人要处理的任务是在流水线上快速地翻转包裹,让二维码一面朝上。
本期嘉宾:陈哲,Alphaist Partners 创始合伙人
本期主播:程曼祺,晚点科技报道负责人
剪辑:甜食
时间线:
02:54 -Q2 Top 5 总览
07:17 -人形马拉松,荣耀夺冠、大厂加码的先声
-Figure 连续直播
14:56 物流,为何是人形机器人的好场景?
21:19 遥操从不是争议点,是真实部署时的必要模块
25:24 星动纪元合作中国邮政,总结过往 to B 机器人的场景选择
28:55 数采范式的 3 次变化
-灵巧手和灵巧操作
34:48 ICRA 最大亮点:舞肌等中国高自由度灵巧手
43:03 灵巧操作:Demo 很惊艳,技术在早期
53:32 再论直驱和绳驱:大厂继续跟绳驱(Optimus),长期仍看好直驱
-世界模型
01:02:57 英伟达 Cosmos 3:从生成视频到直接生成动作
01:08:51 具身的世界模型分类:3 个相交圆
01:14:04 世界模型投资热:大模型教会投资人的事,追逐智能
-Gen-1、π0.7 和不在标签里的公司
01:19:55 π0.7:VLA 融合轻量世界模型
01:22:46 Gen-1:从头预训练,不被路线定义
01:28:40 Google 发布 ER1.6,OpenAI Robotics 团队官宣
-更多讨论
01:37:56 智能部分是否赢家通吃?Omini 模型是个变量
01:42:46 “对长期不确定性探索的容忍度依然差”
01:47:50 -下季度展望:终端大厂加快入场
相关链接:
157 期:【具身季报 26Q1】宇树招股书、人形再思考、英伟达世界模型、高自由度灵巧手
上次季报至今,我们在具身智能、物理 AI 方向的访谈:
166 期:许华哲再次具身创业:不想错过最大的西瓜
165 期:GEAR 高深远:世界模型、自进化循环、DreamDojo
161 期:原力灵机唐文斌:中国最早的 AI 创业者和他的具身新旅程
160 期:群核IPO后与黄晓煌聊这15年:被嫌弃的GPU、冠军酷家乐、空间智能、六小龙
小红书@
访谈Cerebras早期投资人周楠:英伟达挑战者?Scaling Law的萌芽、被遗忘的百度美研
「一段鲜少被人提及的故事。」
今天的嘉宾是目前任职于高通创投(Qualcomm Ventrues)的投资人周楠。她是 5 月中旬 IPO 的 Cerebras Systems 的早期投资人之一。这是一家提供新架构 AI 算力的芯片与系统公司,被外界视作英伟达的补充,甚至是挑战者。
9 年前完成这笔投资时,周楠刚从投行加入百度的硅谷人工智能实验室。那时吴恩达是百度人工智能业务负责人,Anthropic 的创始人 Dario 也曾在百度美研工作,期间作为一作发表了 DeepSpeech2: End-to-End Speech Recognition in English and Mandarin 一文。
今天这期节目,我们从 Cerebras 的 IPO 切入,聊了 AI 算力的趋势,也通过回顾这段投资过程,回到了 10 年前,scaling law 在硅谷萌芽的阶段和当时百度美研的状态。
那是一段现在的地缘环境下,鲜少被人提及的故事,但它值得在 AI 历史中有一席之地。
本期节目的图文版也已经发布:# 从 Cerebras IPO 聊起:AI 算力变化、Scaling law 的萌芽和百度美研往事
本期嘉宾:周楠(Nan Zhou),Qualcomm Ventures 投资人
本期主播:程曼祺 《晚点 LatePost》科技报道负责人
时间线跳转:
-Cerebras IPO,英伟达之外的 AI 算力
03:26 Cerebras 离“英伟达挑战者”还有多远?
11:16 从 Sam Altman 最早投 Cerebras 到如今与 OpenAI 的 200 亿美元订单
18:27 Cerebras 的上限与下限,WSE 架构优劣
-9 年前的那笔非共识投资
23:28 为什么百度当时要投芯片?
29:02 Dario Amodei 的早期代表作 DeepSpeech 2,Scaling laws 的萌芽
32:17 Cerebras, Graphcore, Wave Computing,三选一
37:06 与研究员一起做尽调,逐一排查风险点
46:18 IC 投决过程,未流片前的决策
53:35 Cerebras 的至暗两年,如何挺过流片不顺
-“遗落”的百度美研
01:00:02 “黄埔军校”和一份生不逢时的 deal list
01:04:04 OpenAI 和 Anthropic 早期都未得典型 VC 支持
01:09:04 他们后来为什么离开百度?
01:12:23 起了大早,赶了晚集,一部分是“宿命”
-新的非共识
01:18:30 推理优化和 Infra 的更多创新
01:26:11 真正的早期投资变难,一股趋势是募大钱投显然的 winner
01:31:11 物理 AI,下一阶段的大分歧和机会
**01:35:49 连点成线*
剪辑:甜食
相关链接:
《晚点聊》159 期:马斯克Terafab太空算力、英伟达重拾CPU|与Fusion Fund张璐聊AI算力新趋势
《晚点聊》156 期:【AI季报_26Q1】:OpenClaw、OpenAI vs Anthropic的三重对阵、自进化
附录:一些术语解释
WSE(Wafer Scale Engine,晶圆级引擎):由 Cerebras 公司推出,是将整片晶圆封装为单一芯片的超大算力处理器。
ASIC:专用集成电路,专为特定功能定制设计的芯片。
模拟验证:通过仿真测试电路功能、性能,排查设计缺陷的芯片研发环节。
流片:把芯片设计版图交由晶圆厂,正式量产制造芯片的过程。(本期聊到,百度当时投资 Cerebras 时,Cerebras 尚未完成第一次流片,处于模拟验证的研发阶段。百度对 Cerebras 的性能尽调也是基于模拟推测的。)
Adept AI:曾推出 Devin 的美国创业公司,核心成员 Erich Elsen 曾在百度工作。
Egien AI:本期后面聊到的,被 Nebius 收购的一家 Infra 公司。
小红书@曼祺_火柴Q即刻@曼祺_火柴Q
对话王新宇:美团龙珠怎么投科技?
“具身的泡沫什么时候破?” 王新宇的答案却是:中国投入这个领域的钱不是太多,而是太少。
他是美团龙珠的合伙人,十年前入行时就在投科技,先后在 GGV、昆仑万维战投部工作,2021 年加入美团龙珠,开始负责科技投资。
整个美团系——包括美团战投和美团龙珠——现在是宇树最大的外部股东,累计投资宇树超 4 亿元,合计占股约 9.65%。其中,美团战投持股 7.61%,是宇树科技的早期战略投资者;美团龙珠随后投资,目前持股 2.04%。
宇树刚刚在上周完成科创板 IPO 过会,这成为龙珠科技投资不可忽视的一笔。
王新宇也在 2023 年 7 月的早期阶段就投了月之暗面,这是龙珠重注的一家大模型创业公司。龙珠先后投资月暗 4 轮,并领投了 200 亿美元估值的最新一轮。
从王兴兴到杨植麟,王新宇反复看到一种新的创业范式:由热爱驱动的创业——热爱带来极致的专注和力争世界第一的雄心。他也看到了一类反复出现创业者——“年轻的大哥”:他们实际年龄小,但在某个领域已深耕多年。
本次采访,我们回顾了王新宇十年科技投资的思考和故事和龙珠的科技投资布局。
本期节目的图文版也已经发布:从王兴兴到杨植麟,美团龙珠怎么投科技?
本期嘉宾:王新宇,美团龙珠合伙人
本期主播:程曼祺,《晚点 LatePost》科技报道负责人
剪辑:吴宇量
时间线跳转:
-GGV、昆仑万维:“我能不能吃投资这碗饭?”
01:31 2008 级 5023,“复旦最牛宿舍”
11:37 计算机视觉背景,为何没投 CV 四小龙?
17:05 离开大机构,验证自己能否长期做投资
-美团龙珠:三纵三横里的科技机会
23:37 理想汽车是一笔传奇投资,王兴有不灭的好奇心
33:20 龙珠的“三纵三横”科技推演
38:08 2023 年 7 月投资月之暗面,“见面后,杨植麟打消了我的一切负面疑问”
47:10 DeepSeek 冲击,“人教人教不会,事教人一次就会”
51:27 已投十余家 AI 应用公司,创始人出生高峰是 1997 年
-投入具身智能的钱不是太多,而是太少
01:01:08 2023 年底之后,看懂了宇树,也看到了具身智能大概率会发生
01:11:15 具身智能的链主不一定自己造本体
01:12:47 谈“泡沫”:投入具身的钱不是太多,而是太少
01:19:37 怎么定义具身智能的 GPT-3.5 时刻?
01:28:38 类比自动驾驶,为什么 2019 年是个拐点?
01:33:02 十年前的王兴兴,十年前的宇树
01:43:55 具身市场推演:集中度、产业链分工
01:54:19 语言模型和具身智能之外
02:01:26 一个思想游戏:如果 AI 今天被质子锁死,然后呢?
相关链接:
《晚点聊》 148 期:它石智航陈亦伦:具身的三道曙光和第一道关卡
《晚点聊》 145 期:极壳孙宽:首个「消费级外骨骼」的诞生
小红书@曼祺_火柴Q即刻@曼祺_火柴Q
☆《晚点聊 LateTalk》建立「 播客听友群」啦!☆
欢迎关注科技、商业大公司动态和创业创新的小伙伴进群交流,第一时间收听新节目。
这里有更多互动,更多话题讨论。欢迎贡献选题 & 推荐嘉宾。
请先添加「晚点」小助手的微信号,备注:“晚点聊”,我们邀请您入群。
关注公众号《晚点 LatePost》和《晚点对话》,阅读更多商业、科技文章:
洋葱学园杨临风:用AI制造捷径,是在杀死真学习
「AI 来了,学习这件事会怎么变」
本期嘉宾是洋葱学园联合创始人和 CEO 杨临风,而他一直不怎么追风。
在哈佛读本科时,杨临风修的是计算机,而毕业后,他和朱若辰、李诺在 2013 年创立洋葱学园,做了教育科技,想让更多学生驾驭自主学习。
几年后在线教育融资汹涌,最火的形式是双师直播课、名师录播课等,而洋葱学园都没有做,他们不想做培训,继续用 5~8 分钟的动画内容吸引孩子课外自学。
今天我们聊 AI,临风也不怎么讲流行技术词汇,更多聊学习本身。
与其说洋葱是一家教育公司,它更像一家学习公司。他们一直在研究孩子可以如何自发、自主地学习。这在今天变得更重要了。也可以说,AI 正加速让学习回归本来面目。
本期节目由洋葱学园支持播出。
本期嘉宾:
杨临风,洋葱学园联合创始人 & CEO
本期主播:
程曼祺,晚点 LatePost 科技报道负责人
时间线跳转:
-从公益到创业,追求实现“自主学习”
02:32 哈佛支教、阳光书屋
08:58 自主学习是意愿、能力和工具的协同
16:04 为什么数学?为什么 5~8 分钟动画
28:23 AI 能提升制作教育内容的效率,但提升有限
-在线教育最疯狂的那几年
39:13 不做双师大班课,不追风口
48:30 就算没有双减,双师大班也很难满足教育新需求
-AI 热潮之后
52:51 洋葱、猿辅导、与爱为舞……AI 教育的不同思路
01:05:45 AI 动摇应试教育,但学知识的过程依然必要,学校依然必要
01:11:00 K12 最重要目标:学会自立
01:15:52 各家大模型在教育场景的表现
-回归自主学习
01:18:14 曾经受到的最大质疑:自主学习只适合少数人?
01:28:38 过去相信先赚钱再实现目标,后来发现不必如此
01:33:55 创业不是开不开心的问题
连点成线
相关链接:
108 期:与马毅聊智能史:“DNA是最早的大模型”,智能的本质是减熵
小红书@曼祺_火柴Q即刻@曼祺_火柴Q
☆《晚点聊 LateTalk》建立「 播客听友群」啦!☆
欢迎关注科技、商业大公司动态和创业创新的小伙伴进群交流,第一时间收听新节目。
这里有更多互动,更多话题讨论。欢迎贡献选题 & 推荐嘉宾。
请先添加「晚点」小助手的微信号,备注:“晚点聊”,我们邀请您入群。
关注公众号《晚点 LatePost》和《晚点对话》,阅读更多商业、科技文章:
许华哲再次具身创业:不想错过最大的西瓜
「回到智能,进入家庭。」
从 2026 年 3 月开始,许华哲有了一个新身份:破壳机器人的创始人。之前的两年多里,许华哲是星海图的联创和首席科学家。
这次重新创业,许华哲想自己主导推动一个大梦想:通用机器人,第一步就是家庭机器人。
他也想跳出此前中国具身智能行业的一些路径依赖,更回归通用智能的探索:他说具身智能不是 robotics、不是自动驾驶,也不是“史前深度学习”。
这并不是现在最流行的叙事,他是怎么想的?破壳会怎么做?
本期节目的图文版也已经发布:对许华哲:具身智能不是机器人学,不是自动驾驶,是世界上的新物种
本期嘉宾:许华哲,破壳机器人创始人 & CEO
本期主播:程曼祺,晚点科技报道负责人
时间线跳转:
-科学家创业,不好吗?
01:56 离开星海图,看到家庭机器人
17:02 再次创业的信号与 concern
26:27 “学习好”对创业前所未有地重要
-再次出发的 bet
41:11 不是 Robotics,不是自动驾驶,也不是史前深度学习
56:46 强化学习可能被低估了
01:06:06 “不要小瞧投资人的梦想”
01:10:14 18~24 个月后会?重资源竞争、大公司入场
01:16:32 最好的会在中国发生,但别错过最大的西瓜
-技术之美:简单的、一致的
01:29:18 从游戏到物理世界
01:35:56 大多数科研是“噪音”
01:51:49 技术之美:简单的、一致的
01:57:26 具身智能的“时间检验奖”还没出现
02:08:48 一场尽力的马拉松
02:18:29 创业后,找回曾经的自己
02:23:55 连点成线
剪辑:宇亮、Nick
相关链接,《晚点聊》的往期具身智能创业者访谈:
86 期:国家从无到有,拢共分几步?|工业化之路 01
161 期:原力灵机唐文斌:中国最早的 AI 创业者和他的具身新旅程
155 期:至简动力贾鹏:从英伟达到理想,具身智能的六边形战士
152 期:访谈千寻创始人韩峰涛:20 亿新融资、具身模型淘汰赛、落地非共识
148 期:它石智航陈亦伦:具身的三道曙光和第一道关卡
112 期:与千寻高阳聊具身:一个像机器人的人,怎么做像人的机器人
小红书@曼祺_火柴Q即刻@曼祺_火柴Q
☆《晚点聊 LateTalk》建立「 播客听友群」啦!☆
欢迎关注科技、商业大公司动态和创业创新的小伙伴进群交流,第一时间收听新节目。
这里有更多互动,更多话题讨论。欢迎贡献选题 & 推荐嘉宾。
请先添加「晚点」小助手的微信号,备注:“晚点聊”,我们邀请您入群。
关注公众号《晚点 LatePost》和《晚点对话》,阅读更多商业、科技文章:
GEAR 高深远:世界模型、自进化循环、DreamDojo
本期《晚点聊》,我与刚从港科大博士毕业的一位年轻研究者高深远,他从去年开始在英伟达实习,接下来马上会正式加入英伟达的具身智能实验室 GEAR。
我们聊了深远 2024 年以来一直专注的方向:世界模型。
前 1 个多小时,我们展开了整个世界模型的大图景:它的分类?它是为了解决什么问题?它的现状、瓶颈和未来方向,以及各主要公司的思路。
很多人认为世界模型的说法太模糊、涵盖太多,这是一些早期技术的常见现象,这期正好厘清,目前有哪些做世界模型的方法和思路。
后一部分,我们聊了GearLab 在世界模型上的一些实践。尤其是去年底至今,他们陆续发布的世界模型 DreamDojo,(深远是这个工作的联合一作)以及被认为有可能会取代 VLA 的世界动作模型 DreamZero 的研发历程和具体创新点。也延展聊了世界模型可能的竞争局面。
深远描绘了他认为非常有前景的一种自进化循环——它由世界模型、策略模型(如 VLA、WAM 等)和连接二者的 Agent 构成。在英伟达,世界模型和策略模型有 DreamDojo-DreamZero 的组合,在 DeepMind 有 Genie-SIMA的组合。以下的图示更容易帮助理解播客里的讨论。
图注:图中大脑代表 agent,机器人代表 policy,地球代表世界模型,中间是数据集。世界模型的输出(对世界下一刻的预测)是 agent 的输入,供 agent 给预测打分,打分可用以优化 policy;同时世界模型的输出也是 policy 的输入,而 policy 的输出(动作)是世界模型的输入。同时,agent 也给 policy 做任务规划。
世界模型到 agent 和 policy 是用视频/图像通信;policy 到世界模型是用 action 通信;agent 到 policy 是用文本通信;agent 优化 policy 可以是一个打分数值,也可以是由文本媒介转过来的一种分数信号。
本期节目的图文版也已经发布:与英伟达 GEAR 高深远聊世界模型、自进化循环和 DreamDojo
本期嘉宾:高深远,英伟达 GEAR 研究员
本期主播:程曼祺,《晚点 LatePost》科技报道负责人
剪辑:Nick、甜食
时间线跳转:
- 世界模型大图景
02:19 世界模型是什么? 施加动作,预测世界下一刻的状态
05:35 多 Agent(车/机器人)互联的世界模型
09:57 按世界状态的表征方式分类: 4 种世界模型
15:33 最看好 video 世界模型, 因为数据够丰富
19:36 世界模型为何热起来? 数据增多 + 策略模型变强了
- 世界模型、策略模型和 Agent 的自进化循环
21:42 策略是什么?和世界模型的关系
23:39 WAM(DreamZero)相比 VLM 的变化
28:26 世界模型的一大价值是服务策略: 测评、生成数据、突破物理限制的虚拟强化学习
33:42 循环三要素: 世界模型、策略、Agent,它们如何彼此连接、优化
- 世界模型的未来
43:07 当前最大瓶颈,突破泛化: 物理的泛化、动作的泛化
51:49 世界模型难以横评, 难以直观看到不同模型的差别
55:28 各团队的世界模型进展: DeepMind、Nvidia、OpenAI、General Intuition
- 从自动驾驶到具身,从 AI Lab 到 GEAR
01:02:44 “在学界继续做自动驾驶世界模型没意思了”
01:06:30 加入 GEAR,DreamDojo 和 DreamZero 的发起
01:14:12 在英伟达构建最大规模 Human Center 数据
01:21:05 跨本体的 Latent action,以后还需要吗?
01:28:41 DreamDojo 的评测: 自建 6 个 benchmark 的逻辑
01:34:50 自己不掌握视频基模,能做出有竞争力的世界模型吗?
- 01:45:44 连点成线
相关链接:
157 期:【具身季报 26Q1】宇树招股书、人形再思考、英伟达世界模型、高自由度灵巧手
150 期:【年末AI回顾】从模型到应用、从技术到商战,拽住洪流中的意义之线|Solo
148 期:它石智航陈亦伦:具身的三道曙光和第一道关卡
附录:一些名词解释
- 级联误差,Cascade Error:指在包含多个串联模块或阶段的系统中,前一阶段产生的误差未被纠正,直接传递给下一阶段,误差被放大。
- Genie(Generative Interactive Environments):DeepMind 团队发布的基础世界模型。它能通过一张图或一段文字描述生成一个动作可控的虚拟世界。目前发布到 Genie 3
当AI“杀死”SaaS,与明略吴明辉聊多Agent网络、软件业转型和 AI 新组织
「闭源软件价值消失,从 token 和模型上赚钱。」
今天的嘉宾是明略科技创始人吴明辉。2004 年时,他就在北大计算机系做人工智能研究,硕士期间开始创业。
在这一轮大模型热潮前,明略曾在 2020 年尝试用 AI 做组织智能,大举扩张,包括收购了 Manus 创始人肖宏的上一家创业公司,夜莺科技。这一次 AI 尝试以失败告终。
这没有影响吴明辉现在对 AI 的热情。24 年以来,明略陆续发布了自己的行业模型,完成了上市。在 OpenClaw 引起个人 Agent 热潮后,他们也开始了一场更彻底的变革。
这一期我们聊了 AI 怎么影响 SaaS 和软件,明略做出的应对,他们即将开源发布的多 Agent 协同网络章鱼,以及一个存在已久的组织可以怎么被 AI 改变。
本期节目的图文版也已经发布:对话明略吴明辉:AI 正在杀死 SaaS,但我找到了一条新路
本期嘉宾
吴明辉 明略科技创始人
本期主播
程曼祺 《晚点》科技报道负责人
时间线跳转:
SaaS 已死,软件系统本身会走向开源
01:42 Agent 正杀死 SaaS 已死,数据和上下文的价值更大了
05:53 OpenClaw 开启的新可能:穷人版(不从基模入手的)持续学习
11:53 明略的主业数据挖掘和分析,如何被 AI 改变
19:51 新探索:Agentic Service。软件开源、自训模型赚 Token。
多 Agent 协同网络,“龙虾哲学”
29:15 章鱼想构建集体学习网络, (eˣ)' = eˣ 的指数级增长要给自己造工具
35:51 章鱼开发过程:小团队+AI,核心改造是:认人+权限+信任机制 + 品鉴信号
46:23 龙虾的哲学:康德的义务论约束不了人,但可以约束龙虾
56:30 vs 巨头:章鱼直接开源,“飞书做 AI 转型,也得开源”
01:05:51 自研 GUI-VLA 模型,最大场景是软件自动测试
01:14:35 vs 更小初创企业:1800 人的明略会变得更像“投资公司”
从 Scaling up 到 Scaling Out:站在"被AI欺负的人"那边
01:20:33 scaling up 是追求单性能突破,scaling out 是横向扩展 agent 网络;后者对人的价值更友好
01:26:37 专注行业小型模型,将开源web retriever数据集;Agent 网络可实现个性化持续学习
01:34:19 验证标准:商业成功+ 科学发现能力;风险是“物理猝死”,大脑太活跃
5 年前做 EIP(企业智能平台), 失败的教训
01:37:47 技术判断太乐观,团队共识不够:
01:45:29 1000 多人大团队,"八方神仙"做一个没人懂的产品
01:55:23 从春风得意到减半裁员:看到人的存在;所以现在不裁员,给每个人 AI 船票
01:58:58 希望本身产生力量,尤其是众人的希望
02:03:29 新的 AI 投入何时表现在财务上?
AI 原生一代
02:08:11 看女儿用 AI:AI 原生一代的观察与启发
02:11:37 不再和孩子一起刷奥数题,识别 beautiful 的题才做
02:15:14 没有危险的专业,而是只会 Think 是危险的
02:18:43 工程师的新价值:在不断变化的应用环境里判断需求,这仍是 AI 无法做的
02:24:29 Scaling Out一定会发生:小公司会先做出来
连点成线:Coding is eating the world,从软件重塑世界到代码重塑世界
剪辑:Nick
相关链接:
156期:AI季报26Q1:OpenClaw、OpenAI vs Anthropic的三重对阵、自进化
151期:MuleRun 陈宇森:Claude Code 带来 Agent 创作新范式、未来的软件是日抛式的
小红书@曼祺_火柴Q即刻@曼祺_火柴Q
☆《晚点聊 LateTalk》建立「 播客听友群」啦!☆
欢迎关注科技、商业大公司动态和创业创新的小伙伴进群交流,第一时间收听新节目。
详解DeepSeekV4:Infra巨鲸、百万上下文走进现实、极致效率优化
「走进不同团队的成果,创新从来是连续的,不是跳跃的。」
上周五,DeepSeek V4 发布。我们邀请了两位一线 AI 从业者一起详解 DeepSeek V4 的技术实现和创新想法。
如果一句话概括:DeepSeek V4 并没有带来新的“范式变化”,它是继续在 R1 的“测试时扩展”范式下,用一系列组合创新和工程优化,让百万上下文从理论进入实用。
超长上下文上的稳定表现,正是 Agent 和多步复杂任务亟需的能力之一。
本期涉及的诸多技术术语见 Shownotes 末尾注释。
本期节目的图文版也已经发布:详解 DeepSeek V4:Infra 巨鲸 “四连击”,百万上下文走进现实
本期嘉宾
赵晨阳,RadixArk 工程师,SGLang 开源推理框架开发者
刘益枫,UCLA 博士生
本期主播
程曼祺,晚点科技报道负责人
时间线:
体感、对比、消失的成本、DeepSeek 的节奏
03:01 编程能力与“御三家”有差距;不再采用 DeepSeek 自己提出的 MLA
07:44 不再披露训练成本,“用模型能力说话”
09:23 延期推测:四个耦合的新 feature (新注意力+Muon+mHC+FP4)一起上,难度爆炸
12:36 不是范式创新,沿现有范式仍有巨大提升空间
性能与效率
14:32 提出新的能力方向比刷单个 benchmark 重要
16:41 坦诚的内部评测:9% DeepSeek 工程师不会把V4 Pro 作为编程首选
23:03 单 token 推理的计算量和 KV cache 大幅优化,但解决同样问题的 token 消耗更多了
V4 具体进展
28:32 整体思路:极致的稀疏
33:45 混合稀疏注意力:放弃 MLA,SWA滑动窗口+CSA稀疏压缩+HCA稠密压缩,层间预定义分工
39:37 Muon 优化器已成检验工程能力试金石
48:52 mHC:从 Seed 提出 HC 到 mHC;Kimi 的 Attention Residuals
54:24 Infra 两个关键词:TileLang & FP4
01:10:11 多专家训练+蒸馏的后训练
01:13:20 评测危机:benchmark会过时饱和,evaluation是永恒追求,agent评估未共识
更多讨论
01:19:25 近期模型共性:架构趋同(MOE+Muon),优化方向驱动(agent、coding)
01:25:18 美国追新能力、高定价;中国追性价比、工程极限
01:28:00 V4 最有可能被记住的思想:极致压缩+低激活比+低单token成本,成为后续开源模型起点
剪辑:Nick
相关链接:
158期:V4发布前的DeepSeek:人才竞争、组织特点和独特的AGI目标
143期:再聊 Attention:阿里、Kimi 都在用的 DeltaNet 和线性注意力新改进
104期:我给线性注意力找“金主”,字节 say No,MiniMax say Yes
103期:用Attention串起大模型优化史,详解DeepSeek、Kimi最新注意力机制改进
102期:DeepSeek 启动开源周,大模型开源到底在开什么?
附录:术语、概念解释
- 模型架构相关
Token-wise(词元级)改进:优化模型处理单 token 的过程,通常用于提升注意力计算、上下文建模或推理效率。
Layer-wise 的改进:优化模型不同网络层的结构或计算方式,通常用于提升训练稳定性、表达能力或整体计算效率。
MoE:Mixture of Experts 混合专家网络,让不同“专家”子网络处理不同输入,降低单次计算成本。
哈希路由:把 token、样本或请求分配到不同专家、节点或存储位置的方法。V4 在前几层 MoE 用了哈希路由,避免起始层路由塌缩。
En
批量生素材、模型筛网红|与飞书深诺Meetsocial沈晨岗聊AI时代的出海营销
出海对于中国企业来说并不新鲜,无论是早年的华为、中兴,还是大疆、影石、拓竹这样的消费硬件公司,再到 Tiktok、腾讯游戏、Temu 等互联网公司,成功的例子有非常多。但之所以我们说它是一个新的话题,是因为我们来到这个 AI 的时代,不仅看到大批的 AI 创业公司正在积极的向海外拓展,也见证着 AI 改造他们出海的路径、方式、增长、营销。
过去一年,我们也看到了很多借助 AI 营销翻车的案例,比如麦当劳在荷兰上线的一支几乎是由 AI 生成的节日广告,上线后就迅速遭到了大量的吐槽:不仅仅是画面看起来比较粗糙,更在于这个广告它传达出来的气质被认为是廉价的、偷懒的,没有什么诚意。
今天的播客,我们与飞书深诺 Meetsocial 的创始人兼 CEO 沈晨岗先生一起聊了聊,AI 在今天究竟是如何改变中国企业出海模式的?中国与美国的 AI 营销生态究竟有什么区别?在 AI 时代到来以后,企业需要建立起哪些新的能力,才能在营销战中脱颖而出?
本期节目由飞书深诺特别支持播出
本期嘉宾
沈晨岗,飞书深诺集团创始人兼 CEO
本期主播
高洪浩,晚点 latepost 主笔
时间线:
Part 1 中国企业出海变迁史
04:17 中国企业出海的三个阶段:产品、公司、品牌
07:43 早年中国出海企业没有认识到营销的力量
09:45 2025 年开始中国企业出海营销范式发生变化
12:32 转型成功的出海企业案例:安克
16:18 衡量企业出海能力的模型指标:D-MES
Part 2 AI 时代下,中国企业出海的新变化
22:47 出海营销领域在 AI 上的共识与非共识
25:29 AI 的使用应该与企业的商业化目标相匹配
30:38 过去三年,AI 如何改变出海营销
Part 3 中国与美国的 AI 营销
34:07 硅谷观察记:中美 AI 营销的差异
38:30 美国营销公司的历史包袱导致 AI 难落地
Part 4 AI 在未来将如何改变出海营销
42:16 Agent 时代的出海营销模式
48:42 案例:Agent 变革短剧投流
51:46 AI 时代,创意和审美变得更重要
57:07 出海服务商如何适应 AI 时代
01:01:30 三年和五年后,AI 将如何改变出海营销
☆《晚点聊 LateTalk》建立「 播客听友群」啦!☆
欢迎关注科技、商业大公司动态和创业创新的小伙伴进群交流,第一时间收听新节目。
这里有更多互动,更多话题讨论。欢迎贡献选题 & 推荐嘉宾。
请先添加「晚点」小助手的微信号,备注:“晚点聊”,我们邀请您入群。
关注公众号《晚点 LatePost》和《晚点对话》,阅读更多商业、科技文章:
原力灵机唐文斌:中国最早的 AI 创业者和他的具身新旅程
「不做人形机器人的具身智能创业。」
本期嘉宾是原力灵机的联合创始人和 CEO 唐文斌。
2011 年,他和两位清华同学,印奇、杨沐一起创立旷视,这是中国最早的 AI 创业公司。比 DeepMind 晚一年。
2025 年初,唐文斌成立原力灵机,开始具身智能的新创业。
在本科到研究生时,他做过七年中国信息奥赛国家队的总教练,认识了大量奥赛 “小天才”,其中不少人之后加入了旷视,现在又在原力灵机和文斌一起创业。
本期节目也有视频版,可在小红书、B 站、抖音、视频号平台关注「晚点聊 LateTalk」收看。
本期节目的图文版也已经发布:对话原力灵机唐文斌:当中国最早的 AI 创业者做具身,他选择先不做人形
这期我们聊了竞赛往事、旷视的创业复盘和原力灵机的这 1 年:这是一家不做人形机器人的具身智能公司。也是一家会直接参与多模态基模预训练的公司。
这两件事都是非常规的少数派选择。
原力灵机会给中国具身市场带来哪些不同?请听完整节目吧。
本期嘉宾
唐文斌,原力灵机联合创始人 & CEO
本期主播
程曼祺,晚点科技报道负责人
剪辑:杨
时间线:
竞赛、姚班、IOI 国家队总教练:解题的本质是优化,出题比难题更难
01:49 同时参与三项奥赛:信息奥赛的乐趣是解法不唯一
05:50 本科继续 TopCoder :Challenge 机制下,一次干掉 19 个队
08:29 七年 IOI 国家队教练:出题比做题难
10:31 唐杰的第一个研究生,与印奇相约创业
旷视创业:从体感游戏到 AI 技术平台
15:30 以 CV 技术做体感游戏,登上 App Store 免费榜前三
21:56 Face++ 开放平台,技术驱动 vs 产品驱动的两种创业
24:45 高中生范浩强成为旷视 6 号员工,“强进(周而进)组合” 夺得 ICCV 人脸识别全球冠军
30:19 AI to B 三个总结:价值可量化、不占客户太高成本、避免项目陷阱
十年前的智能机器人
34:31 调度系统才是提效核心,5 轮竞标拿下优衣库上海大仓
41:08 从差点搞砸到见到柳井正,拿下优衣库全球订单
从旷视机器人到原力灵机:参与预训练、不做人形机器人
49:21 从范浩强到张祥雨:旷视的一些 “老人” 为何不散?
53:37 再看「天才策略」:大牛口头禅是 “这不本质”,而影响客户体验的所有东西都本质
01:00:38 具身原生:参与 VLM 预训练,一开始就加入机器人数据
01:11:01 只有具身公司能做的事
01:23:34 不做人形机器人,用模块化组合避免 overkill 或 underkill
01:27:14 RoboChallenge 和 Dexbotic,为何创业公司要开源 Infra?
01:39:39 具身行业会先分散再集中,幸存的个位数公司多数会是中国公司
01:46:34 为了低谷的绸缪:备足干粮、专注投入相信的事
01:55:33 曾做过太多加法,发现 A+B+C≈max(A,B,C)
02:03:50 创业 15 年:感谢一波又一波浪潮,依旧兴奋
02:04:51 真正的通用智能机器人,“这值得投入 lifetime”
02:06:14 连点成线
相关链接:
157 期:具身季报 26Q1:宇树招股书、人形再思考、英伟达世界模型、高自由度灵巧手
155 期:贾鹏创立至简后的首次访谈:从英伟达到理想,具身智能的六边形战士
小红书@曼祺_火柴Q即刻@曼祺_火柴Q
☆《晚点聊 LateTalk》建立「 播客听友群」啦!☆
欢迎关注科技、商业大公司动态和创业创新的小伙伴进群交流,第一时间收听新节目。
这里有更多互动,更多话题讨论。欢迎贡献选题 & 推荐嘉宾。
请先添加「晚点」小助手的微信号,备注:“晚点聊
群核IPO后与黄晓煌聊这15年:被嫌弃的GPU、冠军酷家乐、空间智能、六小龙
「杭州六小龙开始上市了。」
4 月 17 日上午,群核科技登陆港股,成为 “杭州六小龙” 中第一家上市的企业。我们在第一时间专访了群核董事长黄晓煌。
2011 年黄晓煌从英伟达回国,和陈航、朱皓创立群核,当时科技创业还不是主流,英伟达自己也在低谷期。
过去这 15 年,黄晓煌说,他们经历过的 90% 的明星科技企业都消失了或变得默默无闻,而群核一直存在,业务还在增长,做出了中国市占率第一的在线设计软件酷家乐,历经与互联网巨头的竞争而幸存,现在又在 AI 热潮中投入空间智能。黄晓煌说: 活下来比活得亮眼重要。
如果想了解更加 “穷人版” 的 AI 创业故事,或者群核上市后的潜力如何,听听创始人怎么说吧。
本期播客也有视频版,可在小红书、抖音、B站、视频号,搜索《晚点聊》观看。
本期节目的图文版也已经发布:群核 IPO 后与黄晓煌聊这 15 年:被嫌弃的 GPU、冠军酷家乐、空间智能、六小龙
本期嘉宾
黄晓煌,群核科技联合创始人 & 董事长
本期主播
程曼祺,晚点科技报道负责人
时间线:
从 GPU 上云到家装设计软件酷家乐
01:14 2011 年回国创业,在英伟达工作过是 “减分” 的
06:54 酷家乐的诞生:13 年上线,14 年爆发,15 年赚钱
10:53 群核底层是 GPU,提前进入 “token 经济”,也跑不通广告模式
14:37 遭遇巨头竞争,更看清什么是壁垒:单纯的算法是纸老虎
从 “怀疑技术自嗨" 到投入 AI
29:48 2018 年注意到 AI 机会,但一度怀疑自嗨了
38:53 2021 年赴美上市戛然而止,山峰到谷底
40:33 2023 用 Copilot 写代码,意识到 SaaS 要变天→两条路的抉择:自己训练空间模型 vs 为大模型做配套
50:16 复盘错过:2018 年是一个做具身硬件的黄金时期
空间智能
52:10 空间智能是底层能力,不是新业务
54:27 群核的 bet:3D 路线,而非视频生成
01:00:00 欧美具身企业喜欢合成、仿真数据,国内普遍倾向真实数据
01:02:52 两百家具身智能公司不算多,各种设备都会需要智能
01:08:53 从纵到横:英伟达的启发
我创业经历的 90% 明星企业都消失了
01:12:46 先活下来,再选最大的机会
01:05:07 六小龙之后,反对的声音一下子变少了
01:21:25 现在对自己的定位:科研 leader
01:24:10 最痛苦的部分总是跟人相关
01:32:11 自由女神像下的对话,“我不是这么算的”
01:34:15 把公司带向空间智能,一半收入来自空间智能
本期剪辑:杨建宇
相关链接:
157 期:具身季报26Q1:宇树招股书、人形再思考、英伟达世界模型、高自由度灵巧手
图文版:《具身季报 26Q1:宇树招股书、人形再思考、英伟达世界模型、高自由度灵巧手》
155 期:贾鹏创立至简后的首次访谈:从英伟达到理想,具身智能的六边形战士
图文版:《至简贾鹏:最快具身独角兽半年融资 20 亿,做 “六边形战士” 才能活》
152 期:访谈千寻创始人韩峰涛:20 亿新融资、具身模型淘汰赛、落地非共识
图文版:《独家专访千寻创始人:20 亿新融资、具身模型淘汰赛、落地非共识》
149 期:具身模型哪家强?与范浩强、高阳聊具身模型的测评、RoboChallenge,26 年具身展望
148 期:访谈它石创始人陈亦伦:具身的三道曙光和第一道关卡
图文版:《陈亦伦和李震宇创立的具身公司它石智航,不做 VLA、不仿真,不走主流路线》
65 期:
马斯克Terafab太空算力、英伟达重拾CPU|与Fusion Fund张璐聊AI算力新趋势
「马斯克不仅要成为太空经济参与者,也想成为规则制定方。」
这期节目邀请了 Fusion Fund 的创始合伙人张璐,她是 SpaceX 的投资人,而马斯克刚刚在 3 月底发布了一个大计划——Terafab,要联合特斯拉、SpaceX 和 xAI,自建史上最大芯片厂,掌握从设计到制造到部署应用的全栈产能。
其中最科幻的部分,是马斯克希望把 Terafab 80% 的算力部署到太空,建太空数据中心。
Terafab 的目标年产耗电量是惊人的 1TW,是目前全球 AI 算力年耗电量(40~50 GW,1 GW 是 100 万度电,即 100 万 kW)的约 20 倍。
从马斯克的雄心壮志出发,本期聊了太空经济的创业机会和 AI 基础设施领域的变化与机会机会,尤其是英伟达在 GTC 上展现的最新规划。
本期节目的图文版也已经发布:马斯克 Terafab 太空算力、英伟达重拾 CPU,与 Fusion Fund 张璐聊 AI 算力新趋势 | 晚点播客
本期嘉宾
张璐,Fusion Fund 创始合伙人
本期主播
程曼祺,晚点科技报道负责人
时间线:
Terafab:1 TW 的超级算力计划
02:29 Terafab 的多重驱动力: 需求、机器人原生、SpaceX 上市、更少监管
06:46 对地服务有延迟,但太空应用本身也需要算力
17:57 马斯克的带动效应: 太空算力相关创业机会
AI 算力层与 Infra 层新趋势
22:48 英伟达 GTC 发布: 统一平台,异构芯片
30:00 LPU 和 CPU 背后: 是推理(使用模型)和 Agent 需求提升
41:09 xAI 动荡: 招人诚、开人快,“马斯克是一个迷人的暴君”
45:13 Google TPU,足以挑战英伟达 GPU 吗?
企业级 AI
48:54 掌握预算的大企业 CIO/CTO 在想什么?
52:15 看好医疗行业、金融行业 AI 应用
55:14 大企业收购 AI 初创企业带来退出,又催生更多连续创业者
01:02:13 连点成线
剪辑:甜食
相关链接:
115 期:华为发布超节点,如何搅动 AI 算力市场?与魔形智能徐凌杰聊芯片层新变化
小红书@曼祺_火柴Q即刻@曼祺_火柴Q
☆《晚点聊 LateTalk》建立「 播客听友群」啦!☆
欢迎关注科技、商业大公司动态和创业创新的小伙伴进群交流,第一时间收听新节目。
这里有更多互动,更多话题讨论。欢迎贡献选题 & 推荐嘉宾。
请先添加「晚点」小助手的微信号,备注:“晚点聊”,我们邀请您入群。
关注公众号《晚点 LatePost》和《晚点对话》,阅读更多商业、科技文章:
V4发布前的DeepSeek:人才竞争、组织特点和独特的AGI目标|Solo
这期 30 分钟的单口,聊一聊 DeepSeek 这家公司和它近期的变化。
上周四,《晚点 LatePost》发布了关于 DeepSeek 的报道:《V4 发布前的 DeepSeek:人才竞争、组织特点和独特的 AGI 目标》,写了 DeepSeek 的近况,以及这家公司过去的历史和它的一些特质,还有梁文锋对 AGI 以及如何实现 AGI 目标的独特理解。
如果你已经看过这篇文章,其实播客并不会有太多新增信息,而是多了一些个人感受和观察,以及文章发布后的一些反馈与补充。
DeepSeek 真的是一朵 AI 界的奇葩,这里是“奇葩”的原意——“阆苑仙葩”,怎落凡家?在非常追求效率、追求投入的性价比,追求“用实力说话”的市场环境中,DeepSeek 的目标和风格都非常独特,它的存在本身就是小概率事件。
这包括,梁文锋和 DeepSeek 的目标:不是仅卷模型性能,也看重生态建设和探索一些“少数派”方向。也包括工作氛围:DeepSeek 是全球都少有的、不信奉超长时间工作的核心 AI Lab。
梁文锋认为,一个人每天能高质量输出和工作的时间很难超过 6~8 小时,疲劳状态下的昏庸判断反而会浪费宝贵的算力,得不偿失。
这造就了 DeepSeek 的独特和不平凡,某种程度上,也是它如今的一些内外部变化和张力的源头之一。
时间线跳转:
01:37 3 位研究员春节至今离开,为何受关注?
03:43 V4 相关信息(信息有限)
04:27 AI 人才竞争激烈,DeepSeek 要解决公司定价问题
07:54 张力的底层来源:DeepSeek 的目标不是最主流的目标
17:48 更多人为何留下,这是一个怎样的组织
本期主播:程曼祺,晚点 LatePost 科技报道负责人
剪辑:Nick
相关链接:
《V4 发布前的 DeepSeek:人才竞争、组织特点和独特的 AGI 目标》
154 期:从千问变动到「AI 英雄传」,与 DINQ 高岱恒聊传奇 AI 研究员们
153 期:阿里Qwen人事变动:误读、近况、伏笔和未来
小红书@曼祺_火柴Q即刻@曼祺_火柴Q
☆《晚点聊 LateTalk》建立「 播客听友群」啦!☆
欢迎关注科技、商业大公司动态和创业创新的小伙伴进群交流,第一时间收听新节目。
这里有更多互动,更多话题讨论。欢迎贡献选题 & 推荐嘉宾。
请先添加「晚点」小助手的微信号,备注:“晚点聊”,我们邀请您入群。
关注公众号《晚点 LatePost》和《晚点对话》,阅读更多商业、科技文章:
【具身季报 26Q1】宇树招股书、人形再思考、英伟达世界模型、高自由度灵巧手
「不仅是比特,不仅是语言。」
这期节目是我们的第一期具身智能季报,邀请了我很喜欢的一位投资人,Alphaist Partners 创始合伙人陈哲 Peter。
Alphaist 也有自己的播客,就叫《The Alphaist》,这期节目之后也会在 The Alphaist 串台播出。
过去七年,Peter 在五源专注投资机器人和硬件科技,投资过海柔、松灵、本末、地瓜等公司。在去年创立 Alphaist 之后,他想放开手去寻找更多 Alpha Founders。我对这类创始人的理解是:哪怕不被认同,他们也极其笃定自己的判断,是可以定义规则或打破规则的人。
在跨学科、高复杂度、需要开拓精神的具身智能领域,就有不少这样的创始人,也需要更多这样的创始人。
这期节目,我们从本季度的进展着手,Peter 分享了三月中旬去 GTC 与全球从业者的交流,同时也带到了过去两年具身智能的发展。
在讨论人形机器人的部分,我们盘点了中美几家头部公司,如宇树、银河、特斯拉 Optimus、Figure 的近期进展,以及那些在智能能力或数据上给行业带来启发的公司,如 Pi、Sunday 和 Generalist。
图注:银河通用人形机器人打网球 demo。
接着重点讨论了当前具身智能的两个前沿研究方向:灵巧手和世界模型:
在灵巧手部分,我们重点聊了 Sharpa 的进展,和 Optimus 绳驱方案的争议; 在世界模型上,英伟达近期连续发布 DreamZero、DreamDojo 和 EgoScale 数据框架,提出 WAM 世界动作模型,被视为比 VLA 天花板更高的方向。之后的季报里,我和 Peter 会邀请更多从业者一起分享。
图注:Sharpa 灵巧手
本期节目的图文版也已经发布:具身季报 26Q1:宇树招股书、人形再思考、英伟达世界模型、高自由度灵巧手 | 晚点播客
本期嘉宾
陈哲,Alphaist Partners 创始合伙人
本期主播:
程曼祺,晚点科技报道负责人
时间线:
04:48 Q1 TOP 5 进展
-宇树春晚表演,一致性
-Sharpa 灵巧手实机展示,长程任务组装风车
-英伟达发布 DreamZero、DreamDojo,WAM(世界动作模型)而非 VLA
-银河通用机器人打网球
-波士顿动力新版电动 Atlas
人形机器人丨中国
10:37 宇树春晚门道:25 年下半年新技术的集中展现,一致性是大亮点
20:13 宇树做科研市场,从来不被投资市场「喜欢」,但专注才造就 G1 的成功
24:20 王兴兴和汪滔:不极致,不成活;目前的智能能力不影响宇树整体竞争力
28:22 银河通用人形机器人打网球,Karpathy 说“这肯定是 AI 生成的”
34:13 双足价值再思考,波士顿动力 Stretch 机器人的启示
人形机器人丨美国
39:45 新版 Atlas:模块化设计、左右腿可互换,人形也可超人
42:29 Optimus Gen3 再延期,已缩水的 1 万台年产目标仍激进
44:58 Optimus 灵巧手,绳驱vs直驱:绳驱真符合“第一性原理吗”?
48:57 “浮夸”的 Figure 和它“浮夸”的创始人 Brett,顺势而为
52:59 美国本土供应链复兴有长期挑战
57:58 Pi、Sunday、Generalist;Sharpa 提出的三层架构:System2(低频、规划)、System1(高频、动作执行)、System0(触觉)
灵巧手创业友好,世界模型的底层属于大厂
01:07:06 灵巧手市场可能存在宇树在人形市场的 G1 机会
01:14:30 世界模型和英伟达的 WAM(DreamZero、DreamDojo):不再以语言为底层
01:27:18 英伟达 EgoScale 数据框架 & 具身数据的金字塔
01:37:47 视频生成的底层更大厂友好,但世界模型也有创业公司:Rhoda AI 融了 4.5 亿美元
机器人端侧算力:越到新兴市场,英伟达统治力越弱
01:43:42 从云端→车载→机器人:英伟达 GPU 统治力逐步减弱,“创新者窘境”
01:46:26 国产芯片机会:地平线、地瓜在量产机器人市场领先
01:48:24 机器人终局可能高度集中
中国具身上市潮 & 下季度展望
01:53:59 宇树上市,是一家高质量公司的上市,不是泡沫
01:59:59 下季度展望:世界模型超越 VLA、灵巧手进展、马上举行的机器人马拉松比赛从“搞笑”走向竞技
02:04:20 连点成线:前几期具身访谈共性总结;触觉和语言之外
本期剪辑:甜食、Nick
相关链接:
【AI季报_26Q1】OpenClaw、OpenAI vs Anthropic的三重对阵、自进化
「Coding→Agent 大主线明细,从模型的竞争到系统的竞争。」
本期播客本周内也会在《晚点 AI》公众号发布「图文版」,发布后会更新到 Shownotes 和评论区。
从 26 年 Q1 开始,《晚点聊》推出季度总结系列,会分为 AI 季报和具身季报。
其中,AI 季报的嘉宾是身在硅谷的 MoE capital 创始合伙人 Henry Yin。他此前已经两次做客晚点聊,分享过 Agentic 工具链的创新机会,和 Gemini 3 后的新进展,分别是 137 期和 146 期。
本期节目我们从 OpenClaw 开始聊 Q1 的进展,进而延展到 Anthropic 的 Claude Code 和 Cowork 产品的强劲增长,Anthropic 应用形态与 OpenClaw 的相向而行,以及 OpenAI vs Anthropic,两家公司的 coding 产品 Codex vs ClaudeCode 和这背后的最新模型 Opus 4.6 vs ChatGPT-5.4 的三重对阵。所有这一切的快速进展,居然都发生在过去 3 个月。
在 Coding 到通用 Agent 和个人 Agent 这条主线之外,我们也讨论了 AutoResearch 等项目的 AI 自进化能力,和仍处于探索中的其它方向,如持续学习和世界模型。
Henry 也分享了,他在硅谷这个 AI 密度最高的地方,感受到的社会情绪变化:科技大裁员。而我则补充了我了解的中国公司的情况。
不管是 Agent 主战场的快速发展,还是自进化开发方式端倪初现,26 年前 3 个月的变化显示,AI 越来越不只和科技圈相关。
本期节目的图文版也已经发布:AI 季报 26Q1:OpenClaw、OpenAI 与 Anthropic 的三重对阵、自进化 | 晚点播客
本期嘉宾
Henry Yin,MoE Capital 创始合伙人
本期主播
程曼祺,晚点科技报道负责人
时间线:
Openclaw:AI Agent 的 iPhone 时刻
04:30 Q1三件大事:Openclaw异常火爆、头部模型厂商竞争焦点转移、AI自我进化贴近现实
07:35 Openclaw 做对的三件事:本地运行、接入聊天APP、定时任务和长期记忆
10:42 两个使用案例:一周卸载 vs 深度试用
14:03 热度差异:中国国民级、美国不出圈,Why?
17:02 中国开源模型乘势增长:OpenClaw 之父 Peter 安利 MiniMax
22:41 三个不足:贵、不稳定、安全隐患:Meta 对齐负责人的龙虾“生死时速”
OpenAI vs Anthropic 的三重竞争
30:10 大公司竞 “吃龙虾”:英伟达、Anthropic、OpenAI 各自动作
37:14 190 亿 vs 250 亿:Anthropic 收入猛追 OpenAI,Claude Code 也超过了 Cursor
43:53 CodeX 是会编程的 “弱智”,Claude Code 是驱策编程奴隶的主人
48:30 OpenAI 的反思:“我们分心了”
49:57 xAI 的人员动荡,Google 的产品发力
53:04 竞争焦点从模型转向平台:开发者生态、企业信任、成本
AutoResearch 自进化出现端倪
01:07:09 AutoResearch,明确目标的有限搜索空间里,AI 已展现 “自进化”
01:17:00 持续学习的两种方法:贫穷版外挂 & 更新权重的新探索
01:22:48 新方向上的创业机会:几个水下 (Stealth Mode) 公司案例
算力变化:推理↑ CPU↑
01:27:00 GTC 要点回顾:推理重要性提升
01:29:05 Agent 应用带来 CPU 需求提升
科技大裁员
01:31:27 Meta 停工学 AI 一周,Token 消耗量成关键指标
01:35:20 从 “一流人才 + 二流人才” 到 “超一流人才 +AI”
01:42:39 给 Token 收税 ?
下季度展望
01:44:07 DeepSeek-V4、更新权重的持续学习从复杂到简单
01:49:21 连点成线:从 Devin 到龙虾的 1 年半,Agent 即将带来更多变化
剪辑:甜食
相关链接:
150 期:年末 AI 回顾:从模型到应用、从技术到商战,拽住洪流中的意义之线
150 期图文版:《年末 AI 回顾:从模型到应用,从技术到商战,拽住洪流中的意义之线》
146 期:Gemini 3 翻盘背后、Agent 需要什么大模型、RL 创业机会,与前 Google 创业者、硅谷投资人聊湾区动向
137 期:Agent 是机会,造 Agent 的工具也是|从 OpenAI 开发者日聊起|Agent#6
137 期图文版:
至简动力贾鹏:从英伟达到理想,具身智能的六边形战士
「具身智能的竞争,本质是体系的竞争。」
今天的嘉宾是一位没有亮相过的具身智能创业者,理想前自动驾驶技术研发负责人贾鹏。
2016 年,他成为英伟达中国智驾团队的第一个员工。五年后的 2020 年,他加入刚开始自研智驾系统的理想,和团队一起实现了逆袭。
去年夏天,贾鹏创立具身智能公司至简动力,他拉来了之前的上司,理想前 CTO 王凯,以及和他并肩战斗过五年的理想智驾前量产负责人王佳佳一起创业。
它符合中国投资具身智能的一种典型审美——创始团队有丰富的研发和量产经验。在被认为与具身关系密切的自动驾驶战场,打过硬仗、打过胜仗。而且核心团队之间磨合已久,分工默契。
成立的最初半年里,至简就融资 20 亿元人民币,是现在最年轻的具身智能独角兽。
作为创业后的首次访谈,贾鹏在这期节目中完整回顾了从英伟达到理想的智驾探索,再到具身智能的创业思考。
他给公司取名至简,因为他相信,大道至简,越简单的东西,越容易规模化。
本期访谈的视频版已经发布,可在抖音、微信视频号和 B 站,搜索《晚点聊》收看。
本期节目的图文版也已经发布:至简贾鹏:最快具身独角兽半年融资 20 亿,做 “六边形战士” 才能活
本期嘉宾
贾鹏,至简动力创始人 & CEO
本期主播:
程曼祺,晚点科技报道负责人
时间线:
2016~2020 英伟达:“老黄脑门的温度比别人高一度”
00:01 英伟达智驾中国团队第一个员工
09:10 从服务 L4 自动驾驶到转向量产
13:57 从工程师到架构师、多面手
15:13 老黄凌晨 5 点起床看邮件、论文,脑门温度比太太高一度
18:07 英伟达的前瞻投入心法:能抗外压、愿景共享、主业强劲
2020~2025 理想智驾:后来者怎么先交卷
22:30 李想当时怎么想智驾:数据重要性,下半场看智能化,“车和家”
29:25 一起看《全营一杆枪》的日子
34:44 自研第一仗:双 J3 交付高速 NOA,一群 “新手” 的生死战
40:06 抗住压力的转身:有图切无图
48:03 智驾 “做成” 的 3 重指标
2025 的具身创业新起点:“挑战自我成长极限”
51:16 FSD v14 “让人又惊喜、又失望”,该做新的事了
59:41 “第一个大概率会死,但做成的会上第一批”,具身创业现在仍是第一批
01:07:51 模型、产品、组织都要简单;同时得是 “六边形” 战士
01:14:01 具身的终局是 “分散” 的垄断
01:19:46 具身研发分 3 层,“合成数据有用,但绝不是主力”
01:34:30 To A(研究)到 To B 阶段的转换会如何发生?
01:42:01 具身的本质是 Physical Agent:大公司做底座,创业公司做 Agent
01:48:13 不做流水线替代,寻找 “端到端” 任务
具身公司该如何组织 & 行业观察
01:57:23 智驾与具身:相似的、不同的
02:01:34 不设组织架构,以项目驱动团队
02:18:05 少被讨论的现象:硬件还远未成熟
02:19:29 更强具身智能到来时间仍有分歧
02:25:03 具身上市潮之后,会如何?
02:37:28 擅长从 0 到 1 逆风局,创业这半年 “挺爽的”
本期剪辑:宇亮、Nick
相关链接:
152 期:访谈千寻创始人韩峰涛:20 亿新融资、具身模型淘汰赛、落地非共识
149 期:具身模型哪家强?与范浩强、高阳聊具身模型的测评、RoboChallenge,26 年具身展望
148 期:访谈它石创始人陈亦伦:具身的三道曙光和第一道关卡
小红书@曼祺_火柴Q即刻@曼祺_火柴Q
☆《晚点聊 LateTalk》建立「 播客听友群」啦!☆
欢迎关注科技、商业大公司动态和创业创新的小伙伴进群交流,第一时间收听
从千问变动到「AI 英雄传」|与 DINQ 高岱恒聊传奇 AI 研究员们
「美第奇和达芬奇,大公司和 AI 研究员。」
今天的节目分两次录制。嘉宾是高岱恒,Sam,他在 AI 技术圈和开源社区非常活跃,曾是双非土木老哥,后来以因为对 AI 开源项目的贡献进入阿里达摩院,现在自己创业,做了一个找到 AI 人才的 Agent 产品 DINQ。
而本期我们聊的主要话题,却是他的副业和 “消遣”:挖掘 AI 人物故事。Sam 对此非常着迷,在达摩院时,他就很喜欢搜集 AI 大牛的人生故事,那些非典型的、充满反差的经历尤其吸引他。
本期的第一部分,我们聊了上周刚发生的阿里千问的人事变化。Sam 分享了他作为开源模型受益者和前达摩院成员的观察。这整个过程的更具体情况,大家也可以看《晚点 LatePost》从上周到本周发布的 3 篇报道,以及我们的上一期播客。
本期第二部分,我们聊了 Sam 津津乐道的 AI 人物英雄传,在 Sam 眼里,这些不问出处、不拘一格的研究者就像文艺复兴时期的大师。他们有各自的性格、癖好、执念和技术浪漫,这对大型商业组织来说是陌生的、需要适应和理解的,我们也由此聊到了未来的研发型人才市场会如何变化。
本期嘉宾:
高岱恒 Sam DINQ 创始人
本期主播:
程曼祺 晚点 LatePost 科技报道负责人
时间线:
千问变动后续
02:42 千问候选人被搜索量翻了 3 倍
09:34 Model Scope 魔搭社区价值几何?
14:30 美第奇和达芬奇,大公司和 AI 研究员
AI 英雄传(第一次聊,春节前)
22:38 DINQ 的诞生,AI 研究员需要更好地展示、更好地匹配
28:30 他们就像文艺复兴时期的大师
42:26 从土木老哥到达摩院,“当你有了作品,没人在问你学校”
49:52 Adam 发明者、被拒的 GPT-1 一作、旅居越南的 RAG 发明者………创新来自边缘地带
01:10:23 他们的追求、畏惧、不屑和弱点
01:19:38 AI 下的人才市场:从人和公司的匹配,到人和具体任务的匹配
01:43:48 连点成线
相关链接:
134 期:Meta AI 人才动荡,上亿美元为何留不住人?| 与 Pokee AI 朱哲清盘点 AI 组织
本期剪辑:Nick
小红书@曼祺_火柴Q即刻@曼祺_火柴Q
☆《晚点聊 LateTalk》建立「 播客听友群」啦!☆
欢迎关注科技、商业大公司动态和创业创新的小伙伴进群交流,第一时间收听新节目。
这里有更多互动,更多话题讨论。欢迎贡献选题 & 推荐嘉宾。
请先添加「晚点」小助手的微信号,备注:“晚点聊”,我们邀请您入群。
关注公众号《晚点 LatePost》和《晚点对话》,阅读更多商业、科技文章:
阿里Qwen人事变动:误读、近况、伏笔和未来|solo
这期不到 20 分钟的短播客,快速讲了 3 月 3 日(周二)到 4 日(周三)发生了什么,澄清一些广为传播但缺乏事实依据的说法,也回顾了 23 年以来 Qwen 的组织流转和这次人事巨震的伏笔。
Qwen 的变化仍在继续,《晚点 LatePost》会跟踪后续。
这期主要是一线研发人员视角得到的事实和信息,阿里公司和组层面会怎么想、怎么看,接下来怎么做,未来一段时间会更为明朗。
相关链接:
《晚点独家丨林俊旸提出离职,Qwen 多位负责人离开,团队或将调整》
本期主播:程曼祺 晚点 LatePost 科技报道负责人
本期剪辑:甜食
小红书@曼祺_火柴Q即刻@曼祺_火柴Q
☆《晚点聊 LateTalk》建立「 播客听友群」啦!☆
欢迎关注科技、商业大公司动态和创业创新的小伙伴进群交流,第一时间收听新节目。
这里有更多互动,更多话题讨论。欢迎贡献选题 & 推荐嘉宾。
请先添加「晚点」小助手的微信号,备注:“晚点聊”,我们邀请您入群。
关注公众号《晚点 LatePost》和《晚点对话》,阅读更多商业、科技文章:
千寻智能韩峰涛:具身模型淘汰赛和落地的非共识
「26 年不是落地生死之年。」
本期嘉宾,是新近完成近 20 亿元融资,估值突破 100 亿元的具身智能公司 千寻智能的创始人和 CEO 韩峰涛。此前,千寻的联创 高阳也两次做客《晚点聊》,分别是 112 期和 149 期。
90 后的高阳,从伯克利回国加入清华叉院, 是典型的新锐 AI 技术力量,和他搭档的 80 后韩峰涛,则代表中国具身领域的另一条路:他是一位在 2016 年第一轮 AI 热潮时开始做智能机器人的创业老兵。他见证过被抢着要份额的热潮,正如现在的具身赛道;也一度背负个人连带债务,度过行业的冬天。
这期节目,我们回顾了过去 15 年,韩峰涛亲历的中国工业机器人、智能机器人再到具身智能的变化。也聊了近期具身领域,数笔大额融资背后的行业转折和 26 年的竞争主题。
我们提到了 1 次 VLA,0 次世界模型,但提到了好多次客户,这是韩峰涛的肌肉记忆。
但他也反复说:26 年不会是具身行业的落地生死之年,而是具身模型性能快速爆发的一年,这是一个经历过上一轮起伏的创业者,转变的决心。
本期嘉宾:韩峰涛 千寻智能创始人&CEO
本期主播:程曼祺 晚点 LatePost 科技报道负责人
时间线跳转:
-2015-2024:工业协作机器人的 10 年创业:
02:03 浙大、中国核电、国机:找不到工作的模式识别研究生
09:10 国产替代 → 2016 年 AI 热潮 → 大模型:技术变革终于来了
14:37 在大厂下场前成为“中厂”
-2024 第二次创业:千寻智能的成立
22:40 密集见了 100 多人,找到合伙人高阳,“靠谱的太少,骗子太多”
33:02 26 年的具身领域会像 23 年的大模型:模型性能淘汰赛
-解决数据瓶颈
35:55 主要靠真实数据,24 年 5 月开始开发 UMI、外骨骼等穿戴式数采设备
-落地应用探索
46:59 宁德时代在具身行业里广发需求
53:33 场景选择门道:当前智能能力、节拍、精度、负载、价值(用量)和容错率的综合考量
59:01 未来场景拓展:先工业、商业,再家庭;先 to B 再 to C
01:04:37 26 年不是具身落地生死之年,而是模型性能爆发的一年
-从 Robotics 到具身智能
01:15:57 第一次创业起伏:资金链 3 次紧张,背负个人连带债务
01:25:24 新一批年轻创业者有相似的“天真”,“真的见过客户”后会改变
01:28:12 从 Robotics 到 AI 思维的转变:数据,数据
01:33:57 建立一个信任、追求卓越的组织
连点成线
相关链接:
独家专访千寻创始人:20 亿新融资、具身模型淘汰赛、落地非共识
晚点聊 112 期:与千寻高阳聊具身:一个像机器人的人,怎么做像人的机器人
晚点聊 149 期:具身模型哪家强?与范浩强、高阳聊具身模型的测评、RoboChallenge,26 年具身展望
本期剪辑:甜食
小红书@曼祺_火柴Q即刻@曼祺_火柴Q
☆《晚点聊 LateTalk》建立「 播客听友群」啦!☆
欢迎关注科技、商业大公司动态和创业创新的小伙伴进群交流,第一时间收听新节目。
这里有更多互动,更多话题讨论。欢迎贡献选题 & 推荐嘉宾。
请先添加「晚点」小助手的微信号,备注:“晚点聊”,我们邀请您入群。
关注公众号《晚点 LatePost》和《晚点对话》,阅读更多商业、科技文章:
MuleRun 陈宇森:Claude Code带来Agent创作新范式,未来的软件是日抛式的
「软件应用也可以 “3D 打印” 了。」
当 Agent 构造变得越来越简单,会发生什么?Agent 交易平台 MuleRun 创始人陈宇森分享了他的观察和创业实践。
陈宇森是一名少年成名的连续创业者,22 岁从浙大毕业后创办网络安全公司长亭科技,5 年后卖给阿里云,现在他带着对 AI Agent 的理解重新出发。
MuleRun 基于这样一个核心假设,当 Vibe Coding 大幅降低了应用开发门槛,Claude Code 带来 Agent 创作新方法,大量非技术背景的人也能把自己的工作知识和流程封装成一个个勤恳的 AI 骡子,实现个人工作的自动化。
这期内容包含两次聊天,分别发生在 25 年 12 月和 26 年 1 月上旬,不到 1 个月里,随着 MuleRun AgentBuilder 开始内测,陈宇森和 MuleRun 的思路已发生了一些变化。
他认为,未来的 market place 不再会是过去我们熟悉的货架形态,而是在对话中触发交易。MuleRun 的调整本身,也是当前 AI 应用瞬息万变的一个缩影。
这期节目的后半段我们也聊了一个创业 10 年,成立过 4 家公司,经历过成败起伏的创业者,如何以「用心」避免陷入平庸和对抗自我怀疑。
本期节目的图文版也已经发布:访谈 MuleRun 陈宇森:Claude Code 带来 Agent 创作新范式、未来的软件是日抛式的
本期嘉宾:
陈宇森,MuleRun 创始人 & CEO
本期主播:
程曼祺,晚点 LatePost 科技报道负责人
时间线跳转:
-12 月底的访谈:寻找方向、Agent 交易平台的机会与难点
02:20 从 Vibe Coding 到 Agent 交易平台
09:20 Agent 的供给还不够丰富,但 Claude Code 带来拐点
16:41 MuleRun 做的两件事:好的 Runtime、清晰的 Skills、Prompt 的商业化
23:08 同样的技术变化,不同的做法:N8N、Dify、Coze、蚂蚁灵光、马卡龙、Youware
28:54 上线 3 个月:用户反馈、Agent 审核与上架、大量 SOP+少量大模型的开发方式
36:50 做好 Agent 的开发工具和交易平台的难点
40:29 如果 Agent 建造门槛大幅降低,通用 Agent 还存在吗?
-1月中旬的访谈:Agent Builder 内测开启、交易平台不会再是货架式
42:21 再聊 Claude Code:Skills 详解,MuleRun 的 Skill 评价体系(Eval)和安全工作
47:32 “应用的 3D 打印机”,未来的软件是日抛式的,AI 是制造业
52:12 Agent Builder:从套壳模型→套壳“Claude Code”
01:01:22 Agent 构造变简单、数量变多:未来的 Market Place 不应该是货架式的
01:08:32 Agent Builder 的内测效果,Agent 开发工具和交易的界限?
-12 月底的访谈:创立 4 家公司,成功退出过也低谷过,以「用心」对抗平庸
01:15:40 从长亭到同时创业做两家公司,一度觉得自己无所不能
01:25:24 走过下坡路,关过公司,痛苦带来的韧性
01:32:13 一定不要在选择题上出错,「用心」对抗平庸
01:40:16 26 AI 应用市场年会发生什么?跳出 Chatbot、跳过 1 亿甚至 10 亿美元 ARR
01:44:02 连点成线
往期相关节目:
106 期:与真格戴雨森长聊 Agent:各行业都会遭遇“李世石时刻”,Attention is not all you need|Agent#1
137 期:Agent 是机会,造 Agent 的工具也是|从OpenAI开发者日聊起|Agent#6
150 期:年末AI回顾:从模型到应用、从技术到商战,拽住洪流中的意义之线
小红书@曼祺_火柴Q即刻@曼祺_火柴Q
☆《晚点聊 LateTalk》建立「 播客听友群」啦!☆
【年末AI回顾】从模型到应用、从技术到商战,拽住洪流中的意义之线|Solo
这期是「晚点聊」的年终特别节目,在 AI 大事必定发生的春节之前,总结 2025 年和即将过去的蛇年,我们在 AI 领域的观察和见闻。
本期节目,我会以单口的形式来讲述,我将按几个大的主题来串起这一年在 AI 领域的观察,行业的一些大事件,以及「晚点聊」的相关节目,和整个《晚点 LatePost》对 AI 的更多报道。
你将你听到以下 7 个章节的内容:1.模型;2.应用;3.巨头的 AI 之战:字节、阿里、腾讯;4.创业公司们;5.具身智能;6.AI 硬件;7.AI 中的人。
在每个章节中,我会按照若干关键词来展开要点,并穿插指路《晚点聊》的相关往期节目或《晚点》的相关文章。我会把提到的文章,列在 shownotes 里。
历史正在加速发生,AI 洪流中,五色使人迷目。但人是意义的动物,我们总试图理解和抓住什么。
希望这期年底的大型“连点成线”,可以帮听友得到一份正在拓展中的 AI 地图。
时间线跳转:
1.模型
01:10 Agentic Model:R1 | Coding | 多模态
08:58 协同优化:Google | DeepSeek 开源周 | 注意力机制改进、芯片互联
15:22 下一个学习范式:从大脑获得灵感
2.应用
19:49 Agent:Coding 就是 General Agent | 垂类 Agent | Agent 工具链
32:02 Sora App:to C 的想象力
37:19 AI for Science:AI 科学家
3.巨头的 AI 之战
40:23 人才和组织之战
49:51 To C 应用大战
4.AI 创业公司们
01:01:28 大模型第一股
01:07:13 5000 万美元 ARR
01:11:36 全球化与中美之间
5.具身智能
01:14:29 投资和上市潮
01:22:09 数据、模型、本体的进展
01:28:05 5 个落地方向
6.AI 硬件
01:34:50 AI 眼镜能成为下一个入口吗?
01:44:30 深圳的公司们
7.AI 中的人
01:49:48 天价薪酬与失业
01:52:39 使用用 AI 的人
01:54:25 意义感:大模型无法替你活过
相关联链接:
《DeepSeek-V3/R1推理系统概览》
Top Lean AI-native Companies Leadboard:https://leanaileaderboard.com/
本期中提及的《晚点聊》往期节目,可根据期数搜索;本期中提及的《晚点 LatePost》相关报道:
「应用」
《实测豆包手机助手:比价点外卖、自动回微信,AI 操作手机的时代来了?》
《“先抖音后剪映” 不再成立,OiiOii 闹闹聊 AI 时代的创作工具和内容社区丨100 个 AI 创业者》
《他给普通人配了个 “AI 剧组”丨100 个 AI 创业者》
《晚点对话明超平:他们不信 AI coding 会是新的创作方式,我很开心》
《25 岁,他想做 AI 时代的微信丨100 个 AI 创业者》(Intent)
《对话与爱为舞张怀亭:大哥创业不走弯路》
「巨头 AI 之战」
《腾讯在 AI 拐点到来前的 700 天》
《字节 AI 再创业:独立组织、全链条的饱和出击》
《重新认识阿里:大踏步迈向 AI》
具身模型哪家强?|与范浩强、高阳聊具身模型的测评、RoboChallenge,26 年具身展望
「用大规模测评驱散 PR 式 demo 的迷雾。」
虚拟空间的大模型有大量 benchmark,测试非常直观;而在如火如荼的具身领域,怎么衡量模型能力,本身还是需要探索的课题。
这期,我们邀请了两位具身智能从业者,原力灵机联创范浩强和千寻智能联创与首席科学家高阳,一起聊具身模型的测评。
范浩强从高三就开始在旷视工作,有丰富的计算机视觉开发和落地经验;高阳回国前在伯克利 BAIR 攻读博士,和 PI 的联创 Sergey Levine 有诸多学术合作。
去年 10 月,原力灵机和 Hugging Face 联合发起了全球首个具身智能的大规模真机评测平台 RoboChallenge。在前不久释放的最新测评结果中,千寻的 Spirit v1.5 模型登顶榜单,表现超过 π*0.5。
RoboChallenge 测评平台网站:https://robochallenge.ai/home
图注:RoboChallenge 测评现场
在 RoboChallenge 的测评中,机器人不再只活在精挑细选的 Demo 视频里,而是要在多样化的“Table 30”任务中接受真实世界的“毒打”——任务包括碎纸、插花,扫二维码。
这期我们聊了具身模型测评的难点,RoboChallenge、RoboArena 等目前的大规模测评尝试是怎样的思路?行业里心照不宣的 demo 工程,以及 2026 年,我们可能从哪些路径逼近具身智能的 GPT-3 时刻。
范浩强和高阳说,组织和参与测评的过程,组织和参与测评的过程,本身增强了他们对具身的信心,,从 π*0 在 Table 30 任务上只有 20% 的成功率到 π*0.5 的翻倍和一些国产模型的超越,具身仍很早期,但进步速度也很惊人。
本期嘉宾:
范浩强 原力灵机联合创始人
高阳 千寻智能联合创始人、清华大学叉院助理教授
本期主播:
程曼祺 晚点 LatePost 科技报道负责人
时间线跳转:
-发起 RoboChallenge,行业呼唤大规模测评
03:24 范浩强和高阳的从业经验
06:53 RoboChallenge 的发起,见证成功率从 π0 的 20% 到 π0.5 的超 40%
12:40 以往方法的问题:环境不一致、测评不持续、仿真有局限
21:47 对比 RoboArena 和 RoboChallenge:前者是分布式 Zero-shot 测评;后者是集中 few-shot 测评
28:33 上线 2 个多月的观察:超预期的 1 万条测试提交,国产模型超越
33:04 Table 30 任务集的设计,插花、扫二维码等任务的“刁钻”考点
40:24 提交者自己做 fine-tune(微调),开源权重证明诚信;接下来会更新灵巧手的测评
-2026 年具身展望
45:07 学习原理已经收敛,Scaling Data 是 2026 年的行业主题
48:53 4 种数据类型,各团队的不同数据 bet
57:20 落地应用,具身的“Coding”任务是什么?“破圈”时刻何时出现?
01:07:00 大众与从业者之间的认知落差,行业心照不宣的“demo”工程
01:12:50 具身测评可以被 Hack 吗?如何反制 hack?
01:14:52 26 年想验证的问题:具身中国追平美国的 DeepSeek 时刻是否到?基模能否上一个台阶?
01:17:47 连点成线:总结观察具身进展的 3 个维度 & 具身创业团队的不同来源
附录:本期中出现的一些人物、技术名词、项目、公司
-Sergey Levine:Sergey Levine,加州大学伯克利分校教授,机器人强化学习与通用学习系统的重要推动者。曾参与 Google / Google Brain 的机器人与强化学习研究,并共同创立具身智能公司 Physical Intelligence(PI)。
-π 系列模型:PI 提出的通用机器人模型系列,最新版本 π*0.6。
-CIFAR:一个经典计算机视觉数据集,相比之后出现的 ImageNet,它规模更小、分辨率更低,常用于快速实验和教学。
-Sunday Robotics:由 Tony Zhao 与 Cheng Chi 在 2024 年联合创立的家庭场景通用机器人公司。
-Generalist AI:2024 年成立的美国通用机器人 / 具身智能的创业公司。
本期剪辑:Nick
小红书@曼祺_火柴Q即刻@曼祺_火柴Q
它石智航陈亦伦:具身的三道曙光和第一道关卡
「华为前自动驾驶首席科学家投身具身创业。」
本期嘉宾是它石智航创始人陈亦伦,他曾担任大疆创新机器视觉总工程师和华为自动驾驶部门首席科学家。
2021 年,智能辅助驾驶的爆发前夕,陈亦伦在华为带团队开始采集大量真实的驾驶数据,用深度学习替代过去自动驾驶的规则方法,3 万行代码做了过去 200 万行代码的事,这是业界第一批探索端到端智能驾驶的尝试。
陈亦伦说,那一刻,他觉得自己找到了自动驾驶的钥匙,而他还想用这把钥匙去探索一个年少时种下的更大梦想:通用智能机器人,也就是具身智能。
在回到母校清华,于 AIR(智能产业研究院)担任智能机器人方向首席专家 2 年后,2025 年初,陈亦伦和百度原资深副总裁、百度智能驾驶事业群负责人李震宇一起创立它石智航,在最初 2 轮融资中,筹集了超过 2.4 亿美元。创下中国具身智能领域的首轮融资记录。
这期节目,陈亦伦讲述了他从自动驾驶到具身智能的多年技术探索和研发实践,他看到的具身智能的 3 道曙光和 3 道关卡,以及怎么先越过其中的第一道:数据。
本期嘉宾:陈亦伦,它石智航创始人兼 CEO
本期主播:程曼祺,晚点 LatePost 科技报道负责人
时间线:
-从华为、清华到创立它石,看到具身的三道曙光
02:35 用神经网络做自驾规控(PnC),3 万行替代 200 万行代码
11:13 三道曙光:强化学习提升运控(locomotion)能力;LLM 处理任务规划;端到端解决极端案例
17:13 端到端、VLA、世界模型,联系与区别
20:40 三道关卡:数据、算法、后训练
24:43 具身还在第一道关卡,数据;最后能经受大量数据的算法结构会很简单;GPT 最伟大的是定义了训练任务是预测下一个 token,而非架构本身
30:16 定义具身模型的训练任务:建立空间概念、跟世界交互
-数据解法:真实数据而非仿真和视频数据,手套采集而非遥操
40:54 具身需要真实数据,不看好仿真和视频数据
49:42 真实数据只有两个源头,世界与人;真实意味着场景真实、动作真实;为可穿戴设备是唯一解
55:08 手套+第一视角摄像头采集数据的具体实现
59:11 具身充满了硬件场景、本体、数据算法间的交替组合和协同优化,中国有供应链和场景优势
01:05:08 没有选择 VLA,具身会有自己的模型,而不是简单在 LLM 上发展
具身已经到了 Scaling 的临界点
01:13:23 看数据增长趋势,具身已经到了 Scaling 的临界点
01:18:04 它石的落地场景之一是处理柔性材料的线束装配
01:21:15 能自己定义目标的具身公司就是靠谱的;成为别人,不是好的选择
01:22:38 连点成线:往期分享
往期具身智能访谈:
晚点聊 112 期:与千寻高阳聊具身:一个像机器人的人,怎么做像人的机器人
晚点聊 96 期:和楼天城聊 Robotaxi:学习人类优秀司机,让我绝望
晚点聊 86 期:We, Robot-2,清华叉院/星海图许华哲看“Optimus”的门道
晚点聊 65 期:信仰充值的威力:与逐际动力谌骅聊聊 GTC 和人形机器人新进展
剪辑制作:甜食
小红书@曼祺_火柴Q即刻@曼祺_火柴Q
☆《晚点聊 LateTalk》建立「 播客听友群」啦!☆
欢迎关注科技、商业大公司动态和创业创新的小伙伴进群交流,第一时间收听新节目。
这里有更多互动,更多话题讨论。欢迎贡献选题 & 推荐嘉宾。
请先添加「晚点」小助手的微信号,备注:“晚点聊”,我们邀请您入群。
OiiOii闹闹:“先抖音后剪映” 不再成立,AI 时代怎么做创作工具和内容社区
「Agent 的工具可以以终为始。」
今天这期节目,是晚点的作者祝颖丽对 OiiOii 创始人闹闹的访谈。本次访谈的文字版今天也会发布在《晚点科技》公众号上。
OiiOii 是一款动画创作 Agent。刚刚在 25 年 11 月开启内测。闹闹自己是一名动画爱好者,2014年,在微信工作 3 年后,她辞职学了半年动画。但当时她发现,做动画太难了,行业环境也很糟。
时隔10年,在自己创过业,去字节做过剪映,在大模型公司阶跃星辰做过二次元社区产品“狸谱”之后,她找到了用 AI 延续动画梦想的方法。
这期,闹闹分享了她和团队是如何构思和做出 OiiOii 的,以及她过去的创业和大厂经历。
图:OiiOii 官网页面。地址:https://www.oiioii.ai/home)
本期嘉宾:闹闹,OiiOii 创始人
本期主播:祝颖丽,《晚点 LatePost》 作者
时间线跳转:
05:06 先做好工具,再去做内容的社区:因为大家不再能忍受内容的单调了
11:40 市场现状:现在动画的产能和消费非常不对等
16:46 OiiOii为什么是这个形态?
31:04 如果做AI漫剧,商业模式、审美都不一样
41:30 怎么利用和理解不同的模型
51:50 现在的团队分工
53:50 第一次创业做极限运动社区,发现其实喜欢做内容
01:06:17 第一次创业留下的最宝贵的东西:抗体
01:18:15 在字节:对剪映和抖音特效最大贡献是…
01:27:17 去了B站:看到产能被憋着了
01:28:45 OiiOii 后面大致的节奏:填充垂类内容,去海外,做内容社区
往期「AI 应用/AI Agent」创始人访谈:
晚点聊 136:Sora新世界 & Lovart 4个月复盘 | 与陈冕聊怎么做垂类
晚点聊 125:用AI复刻一个「我」,与心识宇宙陶芳波聊身份模型
晚点聊 111:Pokee.ai 朱哲清的 Agent 造法:强化学习作后端,语言模型作前端
《晚点对话明超平:他们不信 AI coding 会是新的创作方式,我很开心》
剪辑制作:Nick
☆《晚点聊 LateTalk》建立「 播客听友群」啦!☆
欢迎关注科技、商业大公司动态和创业创新的小伙伴进群交流,第一时间收听新节目。
这里有更多互动,更多话题讨论。欢迎贡献选题 & 推荐嘉宾。
请先添加「晚点」小助手的微信号,备注:“晚点聊”,我们邀请您入群。
关注公众号《晚点 LatePost》和《晚点对话》,阅读更多商业、科技文章:
Gemini 3翻盘背后、Agent需要什么大模型、RL创业机会|与前 Google 创业者、硅谷投资人聊湾区动向
「一线开发者看到的前排变化。」
本期是 137 期 Agentic 工具链节目的嘉宾返场,Henry 和 Naomi,他们近期刚刚和普林斯顿 AI 加速创新中心联席主任,王梦迪教授,一起成立了一家新的早期 VC,MoE capital。
这次一起的也有两位之前在 Google DeepMind 和 谷歌云 Vertex AI 平台工作 7 年,刚刚创业,成立 Agent 工具层公司 Precur 的戴涵俊和 Bethany。
我请他们分享了,岁末年初,在硅谷观察到的 AI 水温,OpenAI、Google 等一系列新模型进展背后的故事,和围绕当今 Agent 与 RL 生态的创业机会。
这是我们本年关于 Agent 的第 8 期节目。
本期嘉宾:
Bethany Wang,Precur 联创
戴涵俊,Precur 联创
Henry Yin,MoE Capital 创始合伙人
Naomi Xia,MoE Capital 创始合伙人
本期主播:
程曼祺,晚点 LatePost 科技报道负责人
时间线:
-基础模型竞争和幕后故事:Google 在旧金山开 Gemini 3 Party 的同一天,OpenAI 发布 GPT-5.2
06:11 AI 进入实用工作:OpenAI 的 GDPval,Databricks 也发布了 Office QA
14:25 GDPval 在主流知识工作上表现优秀,但基础模型处理长尾问题的 gap 始终存在
19:09 Gemini 3 后,OpenAI、Anthropic、Google、各自的进展
22:15 NotebookLM 和 Nano Banana 策源地——Google Labs,不仅招工程师,也有主编、作家、创作者
24:54 DeemMind 研究员 Orio:Gemini 3 的秘密?预训练还有很多空间;TPU 对 Google 训练的加持
26:34 Google 的 3 层协同优化:从 TPU 到 Infra 到模型;模型和应用;数据和硬件 surface(终端)
30:18 Google TPU 已经更多对外,这对英伟达 GPU 优势的影响
38:02 回顾组织变化:DeepMind 和 Google Brain 的合并与磨合
-大厂竞争中,新公司的成长:围绕 RL 与 Agent 的创业机会
43:31 垂类的机会:弥补基础模型到具体问题的差距;水平的机会:调度层、数据层、工具层都有新公司涌现
50:17 技术新趋势——自我演化:RL、用 RAG 加长记忆有人尝试,但远不是成熟方案
53:32「可训练的工具层」背后的技术变化:code 驱动工具,如 Anthropic 的 PTC(Programmatic Tool Calling)
59:44 RL 创业方向:RL 环境,RL as a Service,RL 应用
01:08:47 Agent 开发者挑选模型的前置条件:用什么云(比如 Azure 客户用不了 Gemini),再看云厂商折扣
01:12:20 Anthropic 的 Claude Code 已成为 Agent 核心,刚发布的 Promatic to Call 探索新开发范式
01:17:13 开源模型使用体验:Qwen 很棒;驶往 NeurIPS 的飞机上,1/3 人在看 DeepSeek-V3.2 技术报告
01:22:04 选择模型时,关注什么 benchmark & 为什么?
01:29:34 模型优化方向预测:加入大量 agent trace 的开源模型,更强的多模态,长程任务优化
01:38:58 连点成线:往期节目推荐
《晚点聊》今年关于 Agent 的更多节目:
晚点聊 106 期:与真格戴雨森长聊 Agent:各行业都会遭遇“李世石时刻”,Attention is not all you need
晚点聊 110 期:《与明势夏令聊Agent竞争:通用入口之战就要来,创业要做垂、做专》
晚点聊 111 期:Poke
极壳孙宽:首个「消费级外骨骼」的诞生
「创业治好了我的死亡焦虑。」
极壳是第一家把外骨骼做成消费级产品的公司。21 年成立以来,他们经历过账上只有20万元人民币的危急时刻,也刚在今年融到了 7000 万美元,出货量达到数万台。
图注:极壳已发布 4 款消费级外骨骼产品。
这只是个开始,远远不意味着成功。孙宽多次告诉我们,消费级外骨骼还在非常早期的阶段;他享受定义一个新品类的乐趣,也深知跨越鸿沟,走出小众市场的挑战。
这是一家起步时没有风口的公司;这是一个父母开手机卖场,从小做各种发明,但没有名校光环的创始人。
孙宽分享了他早年的“折腾”经历,他创立极壳、开发出第一款产品的故事,以及他对未来的更多想象。
图注:孙宽是一个户外爱好者;极壳的主要目标用户是户外人群,外骨骼可以帮助他们增强运动能力。
本期嘉宾:孙宽,极壳创始人 & CEO
本期主播:
程曼祺,《晚点 LatePost》科技报道负责人
李梓楠,《晚点 LatePost》科技报道作者
时间线跳转:
-水滴字幕、光固化 3D 打印机、3 年轮岗、内部创业
03:05《攻壳机动队》、90 后的科学幻想、技术是魔法
13:25 第一份工作:从轮岗 3 年到模块化 PC 的内部创业
18:27 一次误诊后回到初心:做一件做着做着挂了的事也不会后悔
-从 1 人公司,到第一款消费级外骨骼
26:51 1 人公司手搓原型,一度账上只有 20 万元人民币
40:06 做“真有用”的消费级外骨骼:拉高核心正面效果,尽量降低负面影像
49:41 推倒第一代方案,用户体验比新架构重要
01:04:27 正式交付 Hpershell X,有人日行 7 万步,有人重返户外
-效率的迭代:从 40 个月到 5 个月
01:09:11 从成立到第一款产品,40 个月;第二代产品,5 个月
01:05:08 从 1 人公司,到 4 位联创和 200+团队
01:25:47 对拓竹组织的观察:好的人,希望身边都是好的人
-跨越鸿沟
01:32:52 品类跨越鸿沟:营造向往、价格、自研、形态拓展
01:49:47 组织跑得更快
-创业之后更踏实了,“活对了的感觉”
01:56:22 创业治好了我的“死亡恐惧”。
01:59:53 广义的外骨骼,最终是让我们的身体可编程。
02:05:40 连点成线:后记 & 往期节目推荐
往期「消费科技」创始人访谈:
晚点聊 120 期:科创板后再访Insta360刘靖康:这何尝不是一种极限运动!
晚点聊 141 期:大疆激光雷达前负责人做了台“电动轮椅”?与 Strutt 洪小平聊创业两年半:不做人形也能通向具身
往期「AI 硬件」创始人访谈:
晚点聊 107 期:与Haivivi李勇聊月入千万的AI Jellycat:小众AI硬件×大众消费品的交叉口创业
晚点聊 118 期:天生卷王郭人杰:从 97 年的扫地机器人总裁到创业做家庭通用机器人
晚点聊 122 期:10分钟朱啸虎投资,泡泡玛特、米哈游都在试;Fuzozo孙兆治聊AI潮玩
剪辑制作:甜食
小红书@曼祺_火柴Q即刻@
“大而强”到“小而强”|与刘知远、肖朝军聊密度法则、RL 的 Scaling Law 和智能的分布式未来
本期嘉宾,是清华大学的刘知远和肖朝军,他们刚在 11 月的《自然》杂志《机器学习》子刊上发表了封面文章:Densing Law of LLMS,大模型的密度法则。所谓“密度”,就是用更少的算力和数据获得相当乃至更多的智能。
刘知远是清华计算机系副教授和面壁智能首席科学家,肖朝军现在在清华做博士后,也是面壁 MiniCPM 系列的文本模型负责人。
图注:此图描述了 2023 年 4 月之后,主要开源模型的能力密度的变化。能力密度是衡量单位参数/算力下,模型能力的指标。目前版本的密度法则总结了预训练大语言模型的密度变化,o1、R1 等后训练强化学习对能力密度的提升尚未体现在指标里。
我们讨论了密度法则研究的源起,也展开聊了业界提升模型能力密度的具体做法:如何从架构、数据治理、算法和软硬协同优化 4 个环节着手提升模型能力密度。
而再往后,更大的密度提升,可能需要一些全新方法,因为强化学习的 Scaling Law 还未清晰展现,未来可能有两种技术路线:一是继续扩大强化学习的规模,观察其中是否涌现更多泛化能力;二是寻找新的学习方式。
在刘知远的设想中,未来,更高密度的模型,会支持每个人在端侧的专属模型,智能会分布式存在:也许手机都不是最终的入口,而是一个可以随身携带的个人计算设备:“就像一个可以随身携带的 NAS”。
图注:达到 GPT-4V 水平的模型参数规模随时间增长迅速缩减,而端侧算力快速增强,当芯片电路密度(摩尔定律)和模型能力密度(密度法则)两条曲线交汇,端侧设备将能运行以往只能在云端运行的大模型。
性能一直是人们更关注的模型演进的脉络,而这期我们会讨论,在另一条主线“效率”上,我们可以做出什么努力。
本期嘉宾:
刘知远,清华大学计算机系副教授、面壁智能首席科学家
肖朝军,清华大学计算机系博士后、面壁智能 MiniCPM 系列文本模型负责人
本期主播:程曼祺,《晚点 LatePost》科技报道负责人
时间线跳转:
-大模型时代的“摩尔定律”
02:09 Gemini 3 和 Nano Banana Pro 的启发:统一的“自回归式视觉+语言生成”即将突破
04:31 大模型演进的两条主线:能力和效率
10:23 和摩尔定律一样,“密度法则”是行业现实,也是“自我实现”
18:43 每 3.5 个月,大模型的能力密度翻一番
21:01 2023 年下半年的抉择:花几千万再训一个更大的模型,然后呢?
-提升密度的四个环节
27:08 架构、数据、算法、软硬协同优化
30:41 (1) 架构:MoE (混合专家系统) + 注意力机制改进
34:28 (2) 数据治理:Ultra-FinWeb 用 1/10 数据量达到更好效果
40:24 (3) 算法:RL 还没有 Scaling Law,接下来可能有两条路
49:21 (4) 软硬协同优化
52:02 InfLLM-V2 的核心更新:把稀疏注意力做到预训练阶段
55:18 注意力改进趋势:长文本不仅是长输入,更多关注“长输出”
-大模型上车、上手机
58:53 5 年内,手机可跑 GPT-4~5 级别的模型
01:06:23 大模型在汽车上已开始量产落地
01:10:34 “别人得到的,不一定是你失去的”,AGI 既会发生在云端,也会发生在终端
01:15:07 未来入口也许不是手机,而是属于每个人的移动计算终端
-AGI 下一步:自主学习 + 分布式的智能
01:17:40 自主学习→AI 协作网络→真正的创新
01:21:04 2023 年初,有巨头说世界上只会拥有几个大模型,就像 1943 年,IBM 董事长曾说全球不需要超过 5 台主机
01:24:46 AI 助手帮成为更好的工作者
01:28:53 不担心生产过剩,未知领域还太多
01:31:39 机器制造机器,AI 制造 AI
01:40:01 ☆连点成线
相关链接:
晚点聊 143 期:《再聊 Attention:阿里、Kimi 都在用的 DeltaNet 和线性注意力新改进》
晚点聊 103 期:《用Attention串起大模型优化史,详解DeepSeek、Kimi最新注意力机制改进》
剪辑制作:Nick
附录,本期提到的一些论文(更多具体名词解释,见本期文字版):
Densing law of LLMss(《大模型的密度法则》)
阿里、Kimi都在用的DeltaNet是什么?|与杨松琳聊线性注意力新改进
「不仅是提效,线性注意力在数据受限情况下的更多潜力。」
今年初的两期节目(103、104 期)里也讨论过注意力机制,这是大语言模型的核心机制。
9 月 和 10 月,阿里和 Kimi 都发布了相关进展,而且都用到了一个线性注意力成果,DeltaNet。
本期嘉宾,就是 DeltaNet 的核心贡献者之一,现在在 MIT 读博士的杨松琳,她也是线性注意力开源小组 FLA 的发起者。
这期节目在 25 分钟以前很硬核,松琳讲了线性注意力和 DeltaNet 的发展脉络,为何 21 年刚被提出时没引起太多注意,后来怎么进化的。
25 分钟以后,是关注 AI 比较多的文科生,比如我也能完全跟上的部分。我们讨论了,重新去做 full attention 的 MiniMax,以及未来要在旗舰模型上用线性注意力的 Kimi 和阿里的不同选择;线性注意力的优劣势;以及一些脑洞——如果算力无限,还需要线性注意力?松琳给了很有启发的回答。
最后半小时,松琳分享了她作为研究员,怎么习得交叉技能的,怎么开始发起FLA小组等成长经历。
本期嘉宾:杨松琳,MIT 博士生在读,DeltaNet 贡献者
本期主播:程曼祺,《晚点 LatePost》科技报道负责人
时间线跳转:
-DeltaNet 的诞生演进与近期动向
02:07 注意力机制是什么?
04:21 DeltaNet 的提出,用 Delta Rule 来增强 in-context retrieval
09:41 近年的改进主要是模型架构,而非“更新规则”
14:25 阿里 Qwen 团队 apple to apple 比较几种线性注意力混合方式;Kimi Linear 对 Gated Delta 的具体改进
17:00 更新规则和模型架构改进的区别:更新规则是在算子层面“动刀”
19:50 算法出身,自学 Infra;学习 Hazy Research Group 的风格
23:28 Qwen 和 Kimi 大概率在下一代旗舰模型用线性注意力,而 MiniMax 用回 full attention;DeepSeek 目前释放的改进都是“稀疏注意力”
37:07 稀疏注意力 vs 线性注意力潜力对比
39:40 即使算力无限,线性注意力仍有价值,因为它在有限数据中的学习效率更高,而高质量数据正是当前瓶颈
42:28 线性注意力在状态追踪上也可能有效果优势,而状态追踪对 Agentic 很重要
47:33 线性注意力的“归纳偏见”和 The Bitter Lesson:先验与 scalable 并不矛盾
49:30 回应 RWKV(原始智能)彭博:从未说发明 DeltaNet,一直在给 Schmidhuber 署名
-Householder 与 DeltaNet 的联想,像运营产品一样运营技术社区
51:51 关注注意力改进的起点,数学知识、Infra,交叉能力怎么积累?
58:48 发现 Hoseholder 累乘和 DeltaNet 关联的过程
01:02:44 AI 何时能像人这样产生联想?——Prompt 合适,大模型应该能独立发现这个算法
01:04:11 FLA 小组的产生,受 Tri Dao 做 FlashAttention 的启发,像运营产品一样运营技术社区;Kimi 从 FLA 小组招募了线性注意力研究者
-注意力改进的未来趋势
01:11:24 稀疏注意力的改进,DeepSeek 年初 NSA 到最近 DSA 的变化
01:16:44 线性注意力的改进,从线性混合全注意力,到线性混合稀疏注意力(比如混合 DeepSeek DSA 和 Kimi KDA 😀
01:21:10 更广泛来说,关注何种模型演进?——持续学习
相关链接:
图文版:《再谈注意力:阿里、Kimi 都在用的 DeltaNet 和线性注意力新改进丨晚点播客》
晚点聊 103 期:《用Attention串起大模型优化史,详解DeepSeek、Kimi最新注意力机制改进》
晚点聊 104 期:《我给线性注意力找“金主”,字节 say No,MiniMax say Yes》
剪辑制作:Nick
附录,本期提到的一些论文(更多具体名词解释,见本期文字版):
Transformers are RNNs: Fast Autoregressive Transformers with Linear Attention
Linear Transformers Are Secretly Fast Weight Programmers
Parallelizing Linear Transformers with the Delta Rule over Sequence Length
斑马CPO修佳明:一款能主动教学的 AI 产品是如何出现的
教育或许是最难被技术改造的领域,因为它太强调互动、个性化的体验与启发性的反馈,这个过程既难标准化,又无法快速复制。
直到大模型的出现,让人第一次看到了教育被技术大规模改造的可能性。市场上旋即涌现出来的各种五花八门的 AI 教育产品,它们从各种层面试图运用大模型的能力,但也反映出在原理技术到面向市场的商业产品之间,大模型在教育场景的落地还存在着一条难以被清晰描摹的鸿沟。
今天的播客,我们与斑马首席产品官修佳明探讨了这条鸿沟本身,以及斑马逾越它的方式。
基于大模型特点,原生构建的 AI 教育产品应该是什么样的?如何摆脱工具属性,让大模型 Agent 成为一个可以主导教学过程的教育产品?如何设计教学梯度、节奏和目标,既能发挥大模型的主动性,又不让一切偏离教学目的本身?如何让大模型更好理解人类在教学领域积累的各种经验,让它更好实践已被证明有效的各种教学法和教育心理学方法?
对这些问题的回应将决定一款 AI 教学产品的本质,进而决定它的商业化前景。修佳明给出了斑马的回答。
本期节目由 斑马口语 特别支持播出。
本期嘉宾:修佳明,斑马首席产品官
本期主播:申远,晚点 latepost 记者
时间线跳转:
-Part1:斑马心中的全栈式 AI 教育产品
04:36 确定性的方向
08:01 与模型“搏斗”
13:58 为什么开发 delay 了?
-Part2:主动性 VS 被动型,斑马产品的核心差异
20:56 从维持能力到突破能力
24:08 让大模型学会人的教学经验与教学法
29:36 更难的是对(教学)难度的控制
34:16 这种模式适合所有人吗?
35:54 让 AI 提供一种教学情绪价值
41:38 对 AI 外教人格的理解
-Part3:将 AI 产品推向市场
47:37 试用用户的反馈与规则设定
52:06 如何衡量 AI 的教学能力?
56:28 未来的 AI 教学产品会如何发展
59:22 如何运用数据和经验:斑马的 AI 壁垒在哪里
01:04:05 AI 产品还是教育产品?斑马的付费和定价策略
相关链接:
《主导型教育 Agent 产品,是口语学习的终极答案吗?》
本期主播:申远,晚点 latepost 记者
☆《晚点聊 LateTalk》建立「 播客听友群」啦!☆
欢迎关注科技、商业大公司动态和创业创新的小伙伴进群交流,第一时间收听新节目。
这里有更多互动,更多话题讨论。欢迎贡献选题 & 推荐嘉宾。
请先添加「晚点」小助手的微信号,备注:“晚点聊”,我们邀请您入群。
关注公众号《晚点 LatePost》和《晚点对话》,阅读更多商业、科技文章:
Strutt 洪小平:大疆激光雷达前负责人做了台“电动轮椅”?不做人形也能通向具身
「大家更关注 PMF 的 M(需求),但有时 P(产品)做得足够好,M 就能自动打开。」
“大疆系”正成为创投圈的一股小风潮。2023 年夏天,洪小平创立 Strutt(若创科技),他曾任大疆光电部及激光雷达产品线览沃负责人。
Strutt 的首款产品 ev¹ 即将在明年初正式发售 ,它看起来是一台电动轮椅,而洪小平告诉我,ev¹ 不是一台智能轮椅,“而是一种新的移动出行设备”。这听起来有些抽象,直到我在旧金山遇到了 ev¹ 的用户:双臂残缺,只有两根手指的 Usman;脊椎脆弱的 16岁少女 Ali,和患有多发性硬化症的 Joe。
旧金山试用会现场,Scott、Micah 两位 YouTube 博主和 Usman 坐着 ev¹ 比赛,看谁先到达车道末端。(这张照片里就有两台 Insta360 X 系列全景相机,现场也有好几台大疆 Pocket 3。)
我更多感受到的他们与我们的相同。他们不仅想要基础保障,也想要更好的生命体验。科技爱好者 Usman 戴着 Apple Watch 和 Ray-ban Meta,他曾用 Vision Pro 操控 ev¹;Ali 给轮椅编织了花朵;Joe 那天分享了很多他年轻时旅行和玩帆船的旧照片。他们渴望的不是另一台轮椅,而是减少出行顾虑,能去更多地方的自由。
我自己也两次试用了 ev¹,Copilot+ 模式的驾驶体验对我来说也很有趣。洪小平设想,在大型公园、机场等区域,更多人可能都需要 ev¹ 这样的设备。
本期,这位曾经在伯克利研究纳米材料的物理学博士,分享了他在大疆,如何从研究者转型为业务负责人;以及创业两年半以来,组建团队,开发产品、做减法的历程。
本期访谈的图文版:《大疆览沃前负责人洪小平创业:我做的不是一台电动轮椅》
本期嘉宾:洪小平,Strutt 创始人兼 CEO
本期主播:程曼祺,《晚点 LatePost》科技报道负责人
时间线跳转:
-投资人总问:为什么你们不做人形机器人?
02:07 伯克利物理学博士→组建大疆光电部:奔着量产做激光雷达
08:26 大疆→南方科技大学:新工科教育 & 思考创业,锁定「机器人」方向
14:03 直接做人形机器人和具身“终极形态”,是“有方法、没路径”
18:04 OpenAI 加大投入 LLM 时,已有早期信,具身没到这个状态;识别早期信号的核心是数据积累
22:43 看到“老龄化”去收,就是它了!
25:13 个人移动设备能获得宝贵的家庭、生活场景数据
-ev¹ 的诞生,它不是电动轮椅
29:28 ev¹ 是泛个人出行设备,它的完整体验
35:07 出行的自由和喜悦,不分健康或残疾、衰老或年轻
41:13 大家更关注 PMF 的 M(需求),但有时 P(产品)做得足够好,M 就能自动打开
43:26 ev¹ 的开发,从做加法到做减法
47:51 观察用户说不出来的需求;
51:19 ev¹ 也是一个 Robot Helper 和机器人平台:可加传感器、执行器、计算单元等配件
56:50 在双滚机上做 200 万圈测试
58:33 “产品真正帮到人”的感觉,很触动
01:00:54 Go to Market 策略:定价、渠道、规模
-什么是一个好团队?大疆怎么又极致,又“舒适”?
01:03:55 创业,从“定义一个好团队”开始
01:07:25 大疆的“舒适”:技术说话、以结果论英雄、可以专注自己的事
01:12:35 应对未来可能的竞争:品牌、专利布局、团队综合性,本质是团队效率
01:19:33 消费科技公司,在高效 vs 速度上的分布:追觅、Insta360、大疆
01:22:39 为什么大疆到 2019 年才定成文价值观?
01:24:43 Next Question:跨越鸿沟——ev¹ 这样的产品怎么进入大众市场?
01:28:06 连点成线:往期推荐
附(播客中提到的部分术语、人物的表达可见图文版,如 VLA、PaLM-E、RT-2、吴景深等,以下摘录文字版中没提及的部分):
王铭钰:汝原科技创始人,大疆前研发副总裁,主导多款旗舰无人机的工程体系建设。(节目中提到的邀请洪小平加入大疆的港科本科同学)
魏基栋:松灵机器人创始人兼 CEO,大疆 Robomaster 业务的一号员工和联创,2016 年创业;库犸智能割草机即由松灵推出。
拓竹:一家 3D 打印机公司,旗下也有 WorldMaker 3D 模型共享平台;由陶冶创立,他曾任大疆动力系统部门经理、Mavic pro 产品经理、大疆消费级无人机事业部负责人。
Invacare:美国医疗辅助设备公司,以轮椅、助行器等康复产品为主营(节目中提及的已退市的行业公司)。
肖文龙:Strutt 联创,大疆早期动力系统技术负责人。
大疆 Inspire 产品线:定位于“专业级航拍/影视器材”的无人机序列,是航拍行业的主力设备与标杆产品。
张富:香港大学 工程学院机械工程系副教授,研究方向为激光雷达-惯性/视觉融合 SLAM 算法。
激光雷达 SLAM 算法:基于激光雷达点云定位与建图的算法,让机器人在未知环境中自行导航。
相关链接:
晚点聊 120 期:《科创板后再访Insta360刘靖康:这何尝不是一种极限运动!》
晚点聊 118 期:
深势科技张林峰、孙伟杰:AI for Science,从开始到现在
「从物理的黄金时代到 AI 的黄金时代。」
大模型热潮正在深入一个硬核领域:AI for Science,用 AI 加速科学发现。由斯坦福大学前校长参与创立的 AI for Science 公司 Xaira Therapeutics,去年一启动就募资超 10 亿美元;OpenAI 也在今年成立“OpenAI for Science”部门,刚在上个月雇了一位黑洞理论物理学家。
早在 6 年多前,中国的 AI for Science 创业实践已经开始。最适合讲述这个故事的是张林峰和孙伟杰。
2018 年,25 岁的他们创立深势科技。 2022 年 3 月,张林峰写文:《AI for Science 2022:未来已来,即将开始流行》https://mp.weixin.qq.com/s/xhGVSY5jBqVMiXrdSKgdcQ 。8个月后,ChatGPT 才发布。
深势的起点,是用 AI 加速求解量子物理中的“第一性原理计算”,即求解“薛定谔方程”等一系列基础量子物理方程。这是量子论和 AI,跨越百年的两个黄金时代的相遇。
1993 年出生的张林峰来自山西汾阳,因参加物理竞赛保送北大。在定位于跨学科教育的元培学院,他同时修了物理、数学、计算机。与张林峰同龄的孙伟杰来自佳木斯,主修政经哲。两个北方高个儿男孩是院篮球队、羽毛球队队友,也在元培学生会体育部搭档。
大二时,元培体育部举办趣味羽毛球赛后,孙伟杰(左)和张林峰(右)从邱德拔体育馆骑车回宿舍。
6 年多来,深势科技推出了 Hermite 药物计算设计平台、Piloteye 能源电池研发平台;以及一系列预训练科学模型,如分子大模型 Uni-Mol、实验表征大模型 Uni-AIMS 、蛋白质大模型 Uni-Fold、基因大模型 Uni-RNA 等;科学文献大模型 Uni-SMART;和综合这些积累的科研平台与科研 Agent,“玻尔科研空间站” 和 SciMaster;服务了宁德时代、比亚迪、多氟多、长安汽车、京东方、东阳光药、人福医药、诺泰生物等企业客户。
本次访谈,我们与张林峰、孙伟杰一起回顾了他们亲历的 AI for Science 从开始到现在的发展脉络,深势科技在有限资源下经历的焦灼、抉择,和他们在科研平台与垂直应用间的取舍。
多年前,杨振宁曾在一次高能物理学术讨论会上说:“The party is over”,上一个物理大发现的时代已然远去。大三时,张林峰一度迷茫:“我们这一代希望从底层科学出发做点儿事的同学,都缺点儿让人兴奋的大问题。”
现在,派对又开始了。
本期访谈的图文版:__
《对话深势科技张林峰、孙伟杰:AI for Science,从开始到现在》
**本次访谈之后也会发布视频版,可在抖音、B站、小红书、微信视频号搜索“晚点聊”或“晚点”观看。*
本期嘉宾:
张林峰,深势科技创始人兼首席科学家
孙伟杰,深势科技创始人兼 CEO
本期主播:程曼祺,《晚点 LatePost》科技报道负责人
时间线跳转:
-起点:用 AI 加速“第一性原理计算”
01:32 93 年生人学物理,the party is over 的迷茫
08:42 用 AI 加速第一性原理计算:薛定谔方程、密度泛函、分子动力学
-提出 DeePMD:从“两亿核时”到“笔记本跑半小时”
21:31 第一个 milestone:用一套统一方法表示多种“不变性”
26:27 普林 2017 年的 200 多块 P100→DeePMD-kit→DeepModeling 开源社区
29:51 AlphaFold 和 DeePMD,AI 做科研的两种方式
-起步的 5 年:是公司,也是“大学”
32:38 毕业、回国、创业:机会是 AI for Science,不是 get simulation done 然后发论文
42:06 做微尺度的“达索系统”,把量子物理软件化
56:14 人才培养:在 DP “读大学”的少年们
-从机器学习到 Agent,AI 科学家,AI for Science 的五个阶段
01:04:37 机器学习数理建模→预训练→大语言模型→科研 Agent→AI 科学家
01:16:20 Agent 正在重塑科研范式
01:22:46 “科研无国界”被挑战,在中国,更能推动开源、开放
01:29:00 垂直还是平台,一个必须做的取舍
01:32:57 诺奖表彰“第一个”,而基础平台要做“最后一个”
01:39:24 我们为 AI 科学家做好准备了吗?
-热血少年、沙漠流浪、灌篮高手
01:49:13 欲望与勇气,《牧羊少年的奇幻之旅》
01:55:33 “老爹,你最光辉的时候是什么时候?”“就是现在!”
01:57:21 “理想主义的实干者才能改变世界”
01:57:59 Next Question:Innovator 什么样?第一批 AI 发现的新成果
ICCV最佳论文、光年之外、Sand.ai:曹越十年AI之旅,从研究者到CEO
「从模型驱动到垂直整合:Gaga-1 是第一个产物。」
图注:飞书“智能会议纪要”功能为本次播客生成的概要图。
本期节目由飞书特别支持播出!欢迎大家尝试“智能会议纪要”(https://www.feishu.cn/product/ai-meeting-summary?hideHeader=1&utm_from=latetalk),功能,点击前文晚点转述链接,可申请 1 个月免费使用。
2024 年初,刚听说曹越开始新一次创业时,我就找他聊过一次。那时他有一个吸引科技报道者的标签:光年之外联创。
今年 10 月的这次正式访谈中,我有点儿理解了为什么王慧文在 2023 年初见了那么多研究者后,会选择曹越来做技术合伙人——曹越是少数在 ChatGPT 之前,预判到大模型热潮的中国研究者。2021 年,他拿下 ICCV 最佳论文后,离开了微软亚研院,加入了国内最早做大模型的机构,智源研究院。
让我稍感意外的是,曹越做研究员时,就格外关注组织与机制;2021 年,在看到 DALL-E 和 CLIP 后,他开始研究 OpenAI 是怎么协作的,这也是他加入智源的原因之一。
这期节目,曹越回顾了他在清华读本科时,如何看到深度学习,那篇 ICCV 最佳论文的诞生;他从研究员到创业者的转变;对 Sora 的观察,以及 Sand.ai 打造新一代模型 Gaga-1 的思考与实践。
通过学习 OpenAI 等全球顶尖公司,更重要的是通过自己的实践和反馈,曹越现在的认知是,要做一个垂直整合的“端到端”的组织,更好平衡模型进展与从需求出发,10 月中旬 Sand.ai 新发布的模型 Gaga-1 就是垂直整合的产物。它聚焦解决人物表演问题,“人物不一致、表演假”,是许多试图使用 AI 的内容制作者之前最大的痛点。
图注:在 Gaga AI 网站 (https://gaga.art/zh/app) 上,现在可体验音画同出、聚焦人物表演能力的视频生成
在技术驱动的 AI 创业时代,一个模型出身的创始人,如何判断趋势,又怎么学习做 CEO?曹越分享了他的探索和体验。
本期嘉宾:曹越,Sand.ai 创始人兼 CEO
本期主播:程曼祺,《晚点 LatePost》科技报道负责人
**本期播客也有视频版,可在抖音、B站、小红书、视频号搜索《晚点 LatePost》观看。*
时间线跳转:
-从 ICCV 最佳论文到研究 OpenAI 组织力:设计一个系统,最大化压榨算力
02:08 2014 年转向深度学习
03:37 在微软亚研院学到的-1:关注最重要、且有提升空间的 topic
05:09 Swin Transfomer 的诞生,Transformer 被引入视觉任务的两个阶段
11:15 在微软亚研院学到的-2:判断 topic 还不够,得以足够资源做出极致效果
13:02 CLIP、DALL·E 冲击:OpenAI 不是论文驱动,而是设计一个系统,最大化压榨算力
18:10 从 GPT-3 到 ChatGPT,3 年疫情阻隔使 OpenAI 巨变被忽略
-中国为什么没有出现 OpenAI 这样的组织?王慧文说是“不够富”
21:30 和王慧文、梁文锋聊;他们都在 23 年初遍历国内研究者
26:57 问老王:为什么中国没有出现 OpenAI?——“不够富”
32:54 光年之外的经验:一开始就确立了正确的“找人方法论”
34:36 CEO 容易焦虑,这时可以想想大问题
-“真的了解创业后,突然感觉什么都对了”
37:16 23 年 8 月开始思考创业:视频生成让自己兴奋
40:54 创业前的自我觉察:ambitious
46:59 第一个模型 Magi-1 花了 1 年多:低估了自回归路线的难度
50:23 正在发生的业务窗口是“音画同出”
-“Sora 2 是一个端到端的模型,OpenAI 是一个端到端的组织”
52:36 Sora 2 的 3 个特点,第三点最让曹越惊艳
58:23 Sora 2 怎么实现“端到端叙事”的?
01:03:58 Vibes vs Sora,Meta 是缝合,Ope
从你用手机到它更懂你,OPPO的手机AI实践 |与小布负责人万玉龙聊端侧AI|Agent#7
在130 期节目中,我们聊了智谱这样的大模型公司怎么做手机 Agent。本期,我们换一个视角,邀请了 OPPO ColorOS 智能助理部总经理万玉龙博士来分享,手机公司怎么构建和思考移动端的 AI 体验。
作为最主流、最有想象力的智能硬件载体,手机是 AI 入口的必争之地。从苹果、三星、 Google 这样的手机主流厂商和系统级厂商,到掌握超级 APP 的互联网大公司,大家都想抓住这个机会来塑造消费者与 AI 接触的新入口。
在中国市场, OPPO AI 的小布助手是最早一批落地、用户规模也最大的手机智能助手之一,目前月活已超过 1.7 亿。
图注:万玉龙在 2025 OPPO 开发者大会上演讲。
在 2025 年 OPPO 开发者大会之前,我们与万玉龙博士一起讨论了 AI 与手机的结合已经发展到了什么阶段,它接下来会如何重塑这个领域的商业格局和应用服务生态,以及它会如何影响我们的工作与生活。
本期节目有视频版,可在抖音、B站、视频号、小红书等平台搜索《晚点》观看。
本期节目由 OPPO 支持播出。
本期嘉宾:万玉龙,OPPO ColorOS 智能助理部总经理
本期主播:程曼祺,晚点latepost 科技报道负责人
时间线跳转:
-Part 1:手机公司做 AI:新计算、新感知、新生态
01:10 OPPO AI 的新体验
11:56 全球行业共性和 OPPO 特点
20:00 手机 AI 智能助手渗透率低于预期,why?
-Part 2:OPPO 的 AI 实践
31:12 厘清三大场景:生产力、生活、影像
38:17 原点之旅访谈用户的细致发现
41:36 以前的产品是 by design,AI 产品是 by use
47:59 AI 现在还不能帮卖手机,但能增加粘性
52:32 AI 人才加入 OPPO:你想做一个影响上亿人的产品吗?
-Part 3:未来端侧 AI 生态推演
59:40 三类公司的端侧 AI 竞合
01:04:40 体系重塑中:当用户通过 Agent 来使用 App,日活、时长等指标都被重塑
01:11:27 Web 端有 MCP,移动端呢?
01:13:39 用户不会有一堆“AI 管家”
01:20:46 新交互正快速发展,新应用生态还未定型
01:25:02 Next Question:更成熟的 AIOS 长什么样?
01:31:22 连点成线:过往节目推荐
相关链接:
图文版:晚点聊 130:《手机Agent大幕拉开!从刚上线的AutoGLM 2.0聊起,大模型如何改造手机|Agent#4》
晚点聊 110:《与明势夏令聊Agent竞争:通用入口之战就要来,创业要做垂、做专|Agent#2》
剪辑制作:XH&SU
本期主播:
小红书@曼祺_火柴Q即刻@曼祺_火柴Q
☆《晚点聊 LateTalk》建立「 播客听友群」啦!☆
欢迎关注科技、商业大公司动态和创业创新的小伙伴进群交流,第一时间收听新节目。
这里有更多互动,更多话题讨论。欢迎贡献选题 & 推荐嘉宾。
请先添加「晚点」小助手的微信号,备注:“晚点聊”,我们邀请您入群。
Agent 是机会,造 Agent 的工具也是|从OpenAI开发者日聊起|Agent#6
「《晚点聊》✖️ AGI House 第一次聊,之后会陆续更新硅谷的 AI 新趋势。」
本期,我们邀请了两位常驻硅谷的朋友,AGI house 的 Henry Yin 和 Naomi Xia,来一起聊 Agent 工具链(Agentic Tooling)的发展趋势,和这个领域在美国的创业实践。
AGI House 是一个 2023 年开始运营的 AI 创业和投资社区,连接了Andrej Karpathy( OpenAI 联创、Eureka Labs 创始人 )、 Google 创始人 Sergey Brin、Google AI 负责人 Jeff Dean、Anthropic 联创 Ben Mann 等 AI 从业者。
图注:刚刚在 AGI House 组织的技术活动:与 Open AI 论文作者的 technical paper reading event。
Henry Yin 毕业于清华姚班,后前往伯克利攻读博士,期间退学创办思码逸(Merico),用 AI 提升开发者效率,长期关注 Agent 工具链与应用层创新。
Naomi Xia 毕业于沃顿商学院,曾任职于摩根大通 AI 投融资团队,现在负责 AGI House 早期投资,已投资 20 多家公司,如本期提及的 Composio、Livekit 等。
我们第一次录制是在十一前,而假期中的 10 月 6 日,OpenAI 举办了第三次 DevDay,即开发者日。发布了一系列与 Agent 相关的新工具,包括 AgentKit、Evals 等。这次 OpenAI 也带来了 Apps in ChatGPT 和 Apps SDK,这是 ChatGPT 试图变成操作系统的再一次尝试。
本期节目由此分为两部分:
第一部分,我们讨论了刚结束的 DevDay 的亮点; 第二部分,则是对 Agentic Tooling,即 Agent 工具链的发展脉络和当前热门环节的梳理。这一次是《晚点聊》与 AGI house 两位第一次录制。之后我们会定期邀请 AGI House 团队及其社区连接的成员分享在美国 AI 最核心的区域的新变化。
本期嘉宾:
Henry Yin:AGI House 联创 & CTO,LinkedIn @Henry Yin
Naomi Xia:AGI House 合伙人 & 投资负责人,LinkedIn @Naomi Xia
本期主播:程曼祺,《晚点 LatePost》科技报道负责人
时间线跳转:
-OpenAI 开发者日
03:30 Agentic Kit 是 OpenAI 开放了自己练的“一身武功”
09:06 Apps in ChatGPT 和 2023 年 GPTs 的区别
10:53 Canva in ChatGPT 新体验
14:47 OpenAI 不会放弃 to B
18:16 一种批评,AgenticKit 与 AGI 思路背道而驰
21:15 开发者的机会与压力:在别人的地基上建房子
-Agentic Tooling 的 6 次进化
26:33 Agentic Tooling 是什么?近期 3 笔交易/收购看到的状态
31:24 Agentic Tooling 的 6 次进化,对应模型能力的 6 次提升
-当下环节梳理
工具调用
39:59 MCP Server 集成商是做什么?
43:09 当前调用 MCP Server 的数量限制,创造 Rube 等产品的机会
44:18 Composio,一家从印度来美国的公司,怎么从 Agent 厂商转型 MCP server 服务商
49:09 这真是创业机会吗?为何 Anthropic 自己不做?
Voice
53:09 911 也在用的 AI voice 平台
57:25 从 LiveKit 平台看到的调用偏好:Speech to Speech(语音端到端)和 Cascade 模型现在一半一半
59:28 OpenAI 等核心 Lab 的 Voice 动作
记忆
01:01:57 四种记忆:情景、流程、事实/知识、人格/性格
01:04:26 创业案例:Letta,记忆也可以由第
Sora新世界 & Lovart 4个月复盘 | 与陈冕聊怎么做垂类Agent|Agent#5
「不焦虑的团队,做不好 AI 创业。」
5 月内测、7 月公开上线,设计类 Agent Lovart 诞生 4 个月,做到了 20 万日活用户和 3000 万美元的年度预测订阅收入。
9 月底,我与在在旧金山呆了 3 个多月,回国不久的 Lovart 创始人陈冕,聊了他对垂类 Agent 的思考和实践。在 5 月 Lovart 刚上线时,我们有过一次交流。几个月后,这位创始人和 Lovart 这个产品又经历了快速的迭代,Lovart 几乎总能在第一时间接入 Nano Banana 等最新模型,也推出了受好评的 ChatCanvas 等新交互方式,他也在节目中聊了马上会发布的 context 新能力。
陈冕说,快源于他的焦虑。但现在也需要焦虑,因为技术正快速进化:
就在我们这次聊的几天后,OpenAI 发布 Sora app,展现了消费端 AI to C 超级应用的潜力。我们于是在假期里补充聊了他使用 Sora 的感受和接下来可能的行业变化。作为一位产品经理出身的创业者,陈冕对 Sora 有独特的观察。
本期节目分为两部分,一是 “Sora 打开的新世界”,二是陈冕对 Lovart 上线以来的复盘。
“你往往在觉得你短期可能有点高估它(模型和技术进展)的时候,过两天你又发现你低估了它。”陈冕说。这是让如今的 AI 创业者头疼的地方,这也是让他们快乐的地方。
本期嘉宾:陈冕,Lovart 创始人
本期主播:程曼祺,《晚点 LatePost》科技报道负责人
时间线跳转:
-Sora 打开新世界:这不是社交吗?
01:50 4 个小时使用体验:顺滑、Cameo 的社交潜力、Remix 降低共创门槛;“最好的交互不会超过滑动和点击”
10:58 中等体量的公司,可以通过交互创新做出 Sora 吗?
13:17 “虚假的真实”和“真实的虚假”可能同时存在
14:46 巨头战场:无法接受错过,赢下的意义又太大
19:39 OpenAI 的双面性:巨头的资源,创业公司的组织
21:17 风险可能来自节奏错配:技术加速发展,而总有些事无法被加速
-20 万活跃用户、3000 万美元年度预测收入;服务“everyone who wants to create”
24:23 在湾区,反复被问热情,更想清楚了应该服务谁
30:27 旧金山 3 个月:感受氛围、建立团队、离用户更近
41:50 引入全球化投资的节奏?
44:37 20 万日活用户,3000 万 ARR,还没有覆盖服务成本,但不怀疑 Agent 商业模式
-“提前描绘出未来会发生的东西,然后等它发生”
49:06 创业之初看到了 5 个方向,为何从 “Adobe 系”切入?
02:43 垂直 AI 应用本质在做两件事:特别的交互,和特别的 context
57:34 应用公司怎么做增长?“提前描绘未来会发生的东西,然后等它发生”
01:06:00 正在做的能力:给设计更多 context,这包括 reference 和 preference
01:13:43 Lovart 到目前为止是工具,没有计划做社区
01:16:25 离用户更近,同时离技术更近,然后才能做取舍
01:22:51 为什么不再担心开源被闭源甩开
01:24:32 To P 创业窗口接近关闭,下一波机会是 to C
01:27:32 “Adobe 系” AI 公司,谁在牌桌?三类玩家的位置
-节奏感,与必需的焦虑
01:31:35 Timing 在任何时候都重要,但 AI 时代更重要
01:35:34 创业以来经历的 3 次重要 timing
01:36:32 没有错过的原因是,“我很焦虑”,而焦虑是必要的
-挺过危机,韧性来自理性判断后的信念
01:42:52 危机中坚定继续,信念是来自认知
01:44:57 最困难时得到过收购意向,但一开始就没想接受
01:45:50 创业不是残酷,而是痛并快乐
01:47:59 遇强则强,面对 3 次挑战,成就感递增
01:49:44 最害怕自己迭代不够快
01:51:09 用理性的底层,控制感性的表达
01:53:36 第一次自由的、全情的、疯狂的,想做成一件事
-连点成线
01:57:51 Lovart 投资人夏令对垂类 Agent 的思考总结(晚点聊 110 期)
相关链接:
本期图文版:《Lovart 陈冕:Sora 证明巨头无边界,AI 创业得提前描绘未来》
晚点聊 110:《与明势夏令聊Agent竞争:通用入口之战就要来,创业要做垂、做专》
剪辑制作:甜食
本期主播:
小红书@
专访张益唐:70岁数学家,追逐第二次闪电
「反正我们就看,我能不能被闪电击中两次吧?」
*本次访谈的「图文版」和「视频版」今日将同步发布,视频首发于抖音。
本次访谈的图文版链接:《晚点专访张益唐:70 岁数学家,追逐第二次闪电》
图文版里对提及的数学概念、数学家和事件有更多详细注释,可阅读了解更多。
很长一段时间里,张益唐是作为一个励志传奇,而非数学家被人谈论与记忆的。
他身上有能触动所有人的戏剧性:一个北大数学系的天才,在美国博士毕业后因未获导师推荐求职不顺,多年来辗转于列克星敦、纽约的各种临时岗位,一度住在房车里。到 2013 年,他突然在 58 岁“高龄”,以一位大学讲师的身份攻克了百年数论难题“孪生素数猜想”,震惊世界。
今年 6 月底,张益唐举家回国,全职加入中山大学香港高等研究院。我们在他回国不久后前往广州专访了他。
作为一个数学家,张益唐对挫折、低谷、孤独、命运都有自己的解读。
他一直追求独特的想法,他最喜欢的状态,就是能一个人专注地思考数学问题。
你得能想到别人想不到的地方,这很难……但如果不追求独特的想法,很难做出新成果。
在那些世俗意义上困顿的日子里,他因不被人关注,反而保持着自己的视角。在张益唐密集思考孪生素数问题的那几年,数学界曾有过一个权威研讨会,结论悲观。不过张益唐两年后才知道有这个会。
大家觉得好像有一条路有可能做出来,最后谁也没走通,“就差了一根头发丝”。可是数学,你差一根头发丝也不行。
而我是从另外一个角度想的。如果你完全跟着别人弄,别人卡在那儿,你也得卡在那儿。
张益唐长期的挫折与传奇的成功,都源于他面对数学的方式:十几年甚至数十年专注少数几个重大难题,几乎不发表阶段性成果;他像隐士一样独自思考,甚少与同行交流合作。
70 岁的张益唐,仍在攻克下一个大问题:“朗道-西格尔零点猜想”。
大量重要结论都以朗道-西格尔零点猜想的成立为条件,它也被认为可能与证明黎曼猜想有关联。所以张益唐的一位前同事会说,如果张益唐真能证出朗道-西格尔零点猜想,那就好比“被闪电击中两次”。
我们问张益唐,面对想解决的问题,他现在的数学直觉还有多强?“我觉得我还能做。”他说。在 70 岁,一个数学家在追逐他的第二次闪电。
*本期是《晚点 LatePost》的前沿视频访谈系列 Next Quesiton 的第一期,视频首发于抖音。小宇宙的这个音频版会稍长一些,放了更多内容。
本期嘉宾:张益唐,数学家,中山大学香港高等研究院首席科学家
本期主播:程曼祺,《晚点 LatePost》科技报道负责人
时间线跳转:
只解大问题
03:10 “反正我们就看,我能不能被闪电击中两次吧?”
05:46 长时间想少数难题,不追求发论文的频率
09:07 “好运气还是坏运气,一开始你也讲不清楚”
13:31 兴趣起点:9 岁看《十万个为什么》哥德巴赫猜想、费马大定理
14:24 23 岁从锁厂工人成为北大数学系学生
16:04 专业是“计算数学”,但大三开始转向理论数学
数学的直觉
17:17 判断什么问题重要并不难,就看能不能做,敢不敢做
18:09 直觉是对正确的一种预感
20:42 几十年一直盘桓几个难题,是一种什么状态?
22:56 朗道-西格尔零点猜想:已经做出来了,正在寻找简化
25:30 独自面对数学,“交流是个困难的事”
光靠 AI 证不出黎曼猜想
26:46 现在 AI 的很多问题归根结底是数学问题
27:25 光靠 AI 解不出黎曼猜想,数学研究的周期和脑力强度远大于奥赛
28:44 49 年前的“四色问题”,一个错误的预言
31:24 想过黎曼猜想,但没看出一条路
数学家,最重要的专注
32:20 王虹的例子,判断一个人的才能不能看短期
33:28 做数学家,最重要的是专注,这也是一种天赋
35:07 辅导孙女数学,最主要是激发兴趣
“现在是回国最好的时候”
36:10 赴美 40 年后归国,目前中国对基础科学大力投入
37:15 最喜欢的数学环境:一个人不受干扰,写论文
37:40 新计划,资料都在脑子里
41:00 改写论文,“烦得要命”
43:21 普林斯顿高等研究院,给一流人才足够的空间
45:18 北大研究生导师潘承彪先生的“小考验”
47:12 不希望学生转行,但尊重选择
自得其乐,没有退休
48:12 如果给孪生素数问题写一本《费马大定理》?
50:17 “三大悲剧的作者会被人遗忘,但阿基米德不会。”没想过不朽,也不追求
52:02 “更快活”是一句虚拟的话
52:39 25 年没回过,“不想提了”
53:34 “我还可以”
5
Meta AI人才动荡,上亿美元为何留不住人?| 与Pokee AI朱哲清盘点 AI 组织
「在 Meta 工作 7 年的创始人看到了什么?」
2025 年 6 月,Meta 以 143 亿美元收购 Scale AI 49%股权,招募了 28 岁的 Scale AI 创始人亚历山大·王(Alexander Wang);这之后,Meta 又天价招募顶尖 AI 研究员,开出最高 4 年 3 亿美元的惊人薪资。
这些新血液和 Meta 原本的部分 AI 团队在 6 月底正式组成了 Meta “超级智能实验室”(Meta Superintelligence Labs,MSL),由亚历山大·王任负责人。
就在一些人期待 Meta 要一雪 Llama 4 的失利时,9 月,Meta AI 团队离职潮爆发:既有已在 Meta 工作了 12 年、参与 PyTorch 构建的 Bert Maher(确定加入 Anthropic)等老员工离开;也有两位加入不足 2 个月的 OpenAI 研究员又重返 OpenAI(Avi Verma 和 Ethan Knight)。
本期节目,我们邀请了 Pokee AI 创始人朱哲清(Bill Zhu),他在 Meta 工作 7 年多,曾担任 Meta “应用强化学习”部门的负责人,去年 10 月开始创业,做以强化学习为内核的 Agent。
朱哲清分享了他观察到的/硅谷顶尖 AI 人才的流动趋势,以及 Meta、Google、OpenAI、Anthropic 等美国核心 AI 公司的组织特点,和由此延伸的业务策略。我们也讨论了,作为一个 AI 创始人,如何在今天打造原生于 AI(AI-Native) 的新组织。
*播客中提及的斯坦福课程是 CS231N,提及的授课者是 Percy Liang。
本期嘉宾:朱哲清,Pokee AI 创始人
本期主播:程曼祺,《晚点 LatePost》科技报道负责人
时间线跳转:
-Meta 人才动荡
03:00 Meta 曾是创业氛围最浓厚的硅谷大厂,但疫情时变臃肿
07:24 Meta、Google、亚马逊、OpenAI、Anthropic 组织特点盘点
14:15 “办公室政治”的实质是分功不均
17:21 一个组织能否保持目标一致:看 20% 的最关键工作能否被分完
19:24 OpenAI 的分裂,是使命的分裂
21:22 MSL(Meta Superintelligence Lab)现在缺能服众的负责人
26:24 顶尖 AI 人才有开辟新方向的野心,而大公司更想要主流路线上的进展
31:52 工程型人才决定未来 2 到 3 年发展,科学家型人才决定未来十年发展,但你可能活不过两三年
-硅谷吸引力
38:49 顶尖 AI 人才最想要什么?成为促使 AGI 到来的核心贡献者
40:34 人才吸引力:OpenAI、Anthropic 第一档,Google 1.5 档
42:03 OpenAI 和 Anthropic 如果倒了,硅谷一片 AI 投资机构都倒了
45:12 同为大公司,Google 做对了什么?
50:28 ChatGPT 在 ChatBot 的地位并非不受挑战
-AI-Native 的新组织
52:52 从 0 做来做 AI 组织的方法?
57:37 当工程师有了 10 倍产出
01:00:35 信任比以往更重要了
01:09:02 Meta 缺一个走一步、想三步的有经验经理人
01:10:56 推演明年 AI 人才争夺
01:14:17 斯坦福大课之 AI 教育一撇:“上完 CS231N,我能做出 sota 的 LLM 吗?”
-01:18:11连点成线(往期节目呼应)
相关链接:
晚点聊 133:《4000日薪的实习生和零工化的程序员,与脉脉CEO林凡盘点25年AI人才市场》
晚点聊 116:《当AI研究者写科幻,与Meta田渊栋聊他的智能想象:我们终会“所思即所得”》
《对谈 Pokee.ai 朱哲清:强化学习做核心,Agent 的少数派造法》
《晚点独家丨Agent 初创公司 Pokee.ai 种子轮融资 1200 万美元,Point 72 创投,英特尔陈立武等投资》
晚点聊 111:《Agent#3|Pokee.ai 朱哲清的 Agent 造法:强化学习作后端,语言模型作前端》
剪辑制作:甜食
本期主播:
小红书@
4000日薪的实习生和零工化的程序员,与脉脉CEO林凡盘点25年AI人才市场 | 串台「职」无不言
「大厂集体从从“省省省”到“花花花”。」
*本期节目,也发布在了脉脉新上线的官方播客「职」无不言。
本周二(9 月 16 日),中国职场社交平台和招聘平台脉脉发布了《2025年AI人才流动报告》,分析了字节、阿里、腾讯、百度、小红书等很多公司的 AI 人才招募情况、待遇变化和流动情况。
*扫描图中二维码,可阅读完整报告。
或点击链接:《2025年AI人才流动报告》
这期节目,我们分享了这份报告里很多有意思的事实、数据和洞察:
大厂招聘规模总体翻 10 倍; 期权行权条件变得更优惠; 活水到 AI 部门的门槛更低了; 顶尖 AI 方向博士生的日薪已来到 4000 元人民币; 最受欢迎的 AI 方向应届生毕业院校排名:第一是清华,第二是北邮。 ……我们也讨论了未来的工作会怎么演变,AI 会给脉脉这样的职场社交平台和招聘平台,带来什么新机会?林凡看到,白领工作也有被外包和零工化的趋势,硅谷已出现了这样的公司。
AI 不仅在影响具体的工作,也在重塑整个工作的概念本身。
本期嘉宾:林凡,脉脉创始人兼CEO
本期主播:程曼祺,《晚点 LatePost》科技报道负责人
时间线跳转:
- AI 人才市场观察
02:55 Meta 3 亿美元买高级人才,不亏
08:41 相比去年,硅谷核心研究员的 AGI 信念更强了
19:47 中国大厂不在琢磨省钱,从降本增效到增本增效
27:03 字节 AI 岗位招募数量断崖领先,第二名是小红书(与阿里按淘宝、云等板块分开统计有关)
29:42 职言社区里的员工变化:阿里士气反弹,美团员工焦虑股价
37:58 最受欢迎 AI 应届生:清华第一、北邮第二
41:49 顶尖博士生实习生可拿到 4000 元日薪
44:38 初阶工程师招聘数减少,减少更快的还有各类管理岗
- 工作的未来 & 白领零工化
52:09 清华计算机毕业的林凡,博士退学钱经历的千禧 AI 研究
58:01 AI 浪潮给脉脉的机会:第一步是优化招聘各环节
01:03:35 出生即退休的终局之前,我们可能会先经历“人力上云”
01:08:18 当白领和知识工作也借由外包云平台来匹配,收入和职业成就感会怎么变?
01:13:03 脉脉会先做招聘的优化,有可能把招聘本身变成人机混合的企业服务
- AI 之后的教育与职场建议
01:19:57 花钱订阅用最好的 AI 产品,一天至少用十次
01:22:15 提高难以被 AI 化的复杂能力,本质是找到那些难被数据化的能力
01:25:45 工作时间会大大减少,我们都需要寻找真正的兴趣
相关链接:
《2025 年 AI 人才流动报告》(脉脉)
《脉脉林凡:企业与员工没那么对立了,但不是因为谁做了什么》
《脉脉 CEO 林凡:当所有公司都有平等对话的内网,职言就可以关掉了》
剪辑制作:Nick
本期主播:
小红书@曼祺_火柴Q即刻@曼祺_火柴Q
☆《晚点聊 LateTalk》建立「 播客听友群」啦!☆
欢迎关注科技、商业大公司动态和创业创新的小伙伴进群交流,第一时间收听新节目。
这里有更多互动,更多话题讨论。欢迎贡献选题 & 推荐嘉宾。
请先添加「晚点」小助手的微信号,备注:“晚点聊”,我们邀请您入群。
350亿美元大并购后聊 EDA|两位芯片工程师的全面科普:壁垒、AI 加速、国产机会
「看不见的工具,托起每一颗芯片」
本期我们把焦点对准芯片产业链最上游的 EDA(电子设计自动化)。AI 浪潮下,GPU / 算力芯片火爆,但真正决定“芯片能不能做、做得好不好、做得快不快”的,甚至“卡脖子”的,其实是一套看不见的软件工具 —— EDA。 这个市场非常集中,基本被三巨头所垄断。
上个月,三巨头里最大的新思完成了对安似科技 350 亿美元的收购,这也是整个行业有史以来最大规模的并购,也帮新思补齐了“系统级仿真”的能力。再加上一些非市场的因素, EDA 也受到了前所未有的关注。
这期节目我们将和来自国际大厂与国产公司的两位资深工程师,拆解 EDA 的重要性、商业模式与壁垒,讨论 AI 如何重构 EDA 流程与工具栈,以及国产 EDA 的现实切口与长期路线。
本期节目由 Synopsys 新思科技支持播出。
本期嘉宾:
温戈|国际芯片设计大厂工程师,《了不起的芯片》作者
歪睿老哥|资深芯片架构师,《芯术:算力驱动架构变革》作者
本期主播:
邱豪,《晚点 LatePost》作者
程曼祺,《晚点 LatePost》科技报道负责人
时间线跳转:
-什么是 EDA,在半导体里的作用
02:14 摩天大楼的设计图,手机工程师每天用 EDA 比用手机还多
06:34 拆旧芯片设计流程:架构—验证—后端,分别在做什么
19:10 半导体行业的十倍定律:越早发现,越省成本
- EDA 的生意经
22:07 旱涝保收,但能赚铲子钱,赚不到金子钱
25:25 EDA 怎么收费
27:55 国产初创公司获客悖论
- AI 改变 EDA
29:23 用 AI 生成设计代码
33:04 AI 加速芯片设计,帮工程师想新 idea
- 巨头成名史
39:21 长期收购补齐版图
42:10 为什么很难“完全垄断”
- 国产 EDA 的机会
48:10 EDA 都是跟随产业机会发展起来
49:43 主流数字 SoC 渗透难;在模拟/版图提取等单点形成口碑更现实
*- 大模型带来了什么 *
52:33 芯片复杂度通胀
55:44 AI 会替代芯片工程师吗?
57:48 生成 Verilog 成为 AI 创业方向之一
*- 总结展望 *
01:12:59 三个词概括今年的芯片产业
01:19:17 未来十年行业地图的重心
01:24:22 对行业新人的建议
相关链接:
晚点聊 32 期:最怕客户来参观的行业:和谈三圈仔细谈谈芯片
晚点聊 36 期:OPPO 突然中止造芯,生不逢时的雄心
晚点聊 32 期:最怕客户来参观的行业:和谈三圈仔细谈谈芯片
名词解释:
EDA:Electronic Design Automation,电子设计自动化软件,用于芯片从电路设计到版图实现的全流程工具。
Verilog:一种硬件描述语言(HDL),广泛用于数字电路的建模与仿真。
IP:Intellectual Property,在芯片设计中指可复用的功能模块或电路设计单元。
Aart 博士:新思科技(Synopsys)长期 CEO Aart de Geus,被誉为“EDA 教父”,推动逻辑综合等关键技术发展。
逻辑综合:将高层次的硬件描述语言代码(如 Verilog)自动转换为可映射到芯片电路的门级网表的过程。
新思、Cadence、西门子被称为 EDA 三巨头:垄断芯片设计软件核心市场,这一说法大约形成于 2017 年西门子收购 Graphic Mentor,整合 EDA 业务之后。
安似科技(ANSYS):一家总部位于美国的工程模拟软件公司,前不久被新思收购。
剪辑制作:甜食
☆《晚点聊 LateTalk》建立「 播客听友群」啦!☆
欢迎关注科技、商业大公司动态和创业创新的小伙伴进群交流,第一时间收听新节目。
这里有更多互动,更多话题讨论。欢迎贡献选题 & 推荐嘉宾。
请先添加「晚点」小助手的微信号,备注:“晚点聊”,我们邀请您入群。
关注公众号《晚点 LatePost》和《晚点对话》,阅读更多商业、科技文章:
微软怎么用AI?与微软商用市场、广告业务管理层聊AI驱动的增长
「两位微软业务 leader 的 AI 使用方法。」
大公司怎么在这轮 AI 热潮中变化和发展,关系大量经济价值和就业人群。
微软是一个典型案例:它既是 OpenAI 的大投资方和云计算服务提的供者者,是这轮热潮的推动者之一;同时,这家超过 20 万人的巨头,自己也需要让整个组织更好地与 AI 协作,抓住 AI 带来的增长机会。
微软 2025 财年第二季度财报里提到:AI 业务已实现超过 130 亿美元年化收入,同比增长 175%。(AI 业务值: Copilot、Azure AI 服务、与 OpenAI 合作带来的订阅与云收入)
这期,我们就邀请了两位微软的管理层:段微之和黄秀兰,来和我们分享,作为微软内部的业务 leader,她们怎么和团队一起,用 AI 提效和增长。两位所处的领域,分别是销售与客户服务,以及广告业务,这刚好是重要的 AI to B 场景。
两位也都是有 20 多年经验的职业女性。段微之先后任职于甲骨文、EMC、亚马逊云科技(AWS)等全球科技公司;黄秀兰先后任职于 Stripe、戴尔、Google,加入微软前曾担任大宇无限 CEO。在本期后半段,她们也分享了一些职场发展经验。
本期节目录制于 GPT-5 发布前夕,段微之在节目中提到了孩子在用“苏格拉底对话式”教育 App,而就在一周多后,“苏格拉底”模式就成了 ChatGPT 的一个功能。
颠覆、炸裂似乎正在变少,但 AI 也正在每天、每周,都变得好用一点点。在微软,这已经变成了一些可统计的业务增长指标。
本期嘉宾:
段微之,微软大中华区副总裁,商用企业及新兴市场事业部总经理
黄秀兰,微软广告业务中国区副总裁
本期主播:程曼祺,《晚点 LatePost》科技报道负责人
时间线跳转:
-在微软,AI怎么驱动业务增长?
02:45 微软内部全面使用 Copliot 365
06:43 GPT-4o 后,Copilot 能力进一步提升
08:16 使用 AI 的震惊时刻:Copliot 的视频会议即时翻译
12:18 AI 怎么提升微软广告收入:从素材生成→智能投放→数据复盘的全链路
16:42 AI 销售提效,一组数字体现
21:48 企业客户用 AI 的成败总结:前提是数据
24:34 微软做任何事,不会不考虑商业闭环
32:34 关注的 AI 趋势:GPT-5、Agent
34:52 靠编程 Agent,作为文科生也能开发、上线一款游戏小 App
-非技术部门怎么学AI技能,给 15 年前自己的职场建议
36:42 大量内部课程可选,非技术人员也能用 AI DIY 业务工具
41:30 扭转工作习惯没那么容易,对 AI 渗透有 KPI 考核
46:46 AI 进入生活:旅游攻略、多语言学习、苏格拉底式教育
51:27 工作与生活的平衡?为何对两位都不是问题
58:25 给 15 年前的自己的建议:更简单化的生活,销售的关键不是 social
01:03:43 “我要坐第一排,要第一个发言”,要有自己的 voice
** -「连点成线」**
01:15:18 Coding 作为创作 & 服务企业客户时,数据治理的重要性
特别企划:
《晚点 LatePost》和 AI 产品点评网站「观猹」联合发起了一份 lite 调研问卷,只有 10+ 个选择题,填写仅需3-5分钟!我们想了解:AI 应用产品在“模型调用”方面的真实现状——到底在不同场景中,哪些模型最多人用?最受欢迎?
调研数据脱敏后会成文公开,分享给大家,所有原始数据将被严格保密。问题也不涉及产品名称等敏感信息。
欢迎听友中的各位 AI 产品开发者和创造者来填写!十分感谢!!😄填写链接:
https://www.wjx.cn/vm/eGkVD4a.aspx#
相关链接:
《独家专访飞书 CEO 谢欣:Office 是一个伟大的产品,而我们想做新时代的 Office》
《晚点对话明超平:他们不信 AI coding 会是新的创作方式,我很开心》
《晚点聊》106: 与真格戴雨森长聊 Agent:各行业都会遭遇“李世石时刻”,Attention is not all you need
《晚点聊》110: 与明势夏令聊Agent竞争:通用入口之战就要来,创业要做垂、做专
《晚点聊》127: 与真格戴雨森 25 AI 中场复盘:OpenAI的IMO金牌、Kimi K2翻盘、Agent普及和抢人大战
剪辑制作:甜食
本期主播:
小红书@