Seventy3

40 Episodes
Subscribe

By: 任雨山

73播客,名字取材于Sheldon最喜欢的数字,内容由NotebookLM生成,每天跟随AI读AI业界论文。

✂️ Turn this podcast into clips
【第639期】智能数学协作:加速数学研究的AI引擎
【第639期】智能数学协作:加速数学研究的AI引擎 episode artwork
Today at 4:00 PM

Seventy3:借助NotebookLM的能力进行论文解读,专注人工智能、大模型、机器人算法、crypto方向,让大家跟着AI一起进步。
如果你想要解读自己的论文,获得更多曝光度。请联系小助手微信:seventy3_podcast 加群。
合作邮箱:zhiwudazhanjiangshi#gmail.com
今天的主题是:
AI co-mathematician: Accelerating mathematicians with agentic AI
Summary
我们引入了“AI 联合数学家”(AI co-mathematician)——这是一个供数学家使用的工具平台,旨在通过交互方式利用 AI 智能体来开展开放式研究。
该系统经过优化,能够为数学工作流程中充满探索性和迭代性的现实需求提供全方位支持,包括构思、文献检索、计算探索、定理证明以及理论构建。通过提供一个能够管理不确定性、细...去小宇宙查看完整单集简介
前往小宇宙评论区与主播互动


【第638期】AutoTTS:大语言模型推理时间计算分配的自动发现
【第638期】AutoTTS:大语言模型推理时间计算分配的自动发现 episode artwork
Yesterday at 4:00 PM

Seventy3:借助NotebookLM的能力进行论文解读,专注人工智能、大模型、机器人算法、crypto方向,让大家跟着AI一起进步。
如果你想要解读自己的论文,获得更多曝光度。请联系小助手微信:seventy3_podcast 加群。
合作邮箱:zhiwudazhanjiangshi#gmail.com
今天的主题是:
LLMs Improving LLMs: Agentic Discovery for Test-Time Scaling
Summary
测试时扩展(Test-time scaling, TTS)已成为通过在推理期间分配额外计算来提高大语言模型性能的有效方法。然而,现有的 TTS 策略很大程度上是手工设计的:研究人员往往凭直觉手动设计推理模式并调整启发式规则,导致大部分计算分配空间未被探索。
我们提出了一种环境驱动的框架 AutoTTS,它改变了研究人员的设计范式:从...去小宇宙查看完整单集简介
前往小宇宙评论区与主播互动


【第637期】大模型多智能体系统:LIFE 演进综述
【第637期】大模型多智能体系统:LIFE 演进综述 episode artwork
Last Sunday at 4:00 PM

Seventy3:借助NotebookLM的能力进行论文解读,专注人工智能、大模型、机器人算法、crypto方向,让大家跟着AI一起进步。
如果你想要解读自己的论文,获得更多曝光度。请联系小助手微信:seventy3_podcast 加群。
合作邮箱:zhiwudazhanjiangshi#gmail.com
今天的主题是:
Life Beyond Individual Intelligence: Survey-ing Collaboration, Failure Attribution, and Self-Evolution in LLM-based Multi-Agent Systems
Summary
基于大语言模型(LLM)的自主智能体在推理、规划和工具使用方面已经展现出了强大的能力,但在任务需要跨角色、工具和环境进行持续协同(coordination)时,它们依然受到限制。
多智...去小宇宙查看完整单集简介
前往小宇宙评论区与主播互动


【第636期】δ-mem:大语言模型的高效在线关联记忆机制
【第636期】δ-mem:大语言模型的高效在线关联记忆机制 episode artwork
Last Saturday at 4:00 PM

Seventy3:借助NotebookLM的能力进行论文解读,专注人工智能、大模型、机器人算法、crypto方向,让大家跟着AI一起进步。
如果你想要解读自己的论文,获得更多曝光度。请联系小助手微信:seventy3_podcast 加群。
合作邮箱:zhiwudazhanjiangshi#gmail.com
今天的主题是:
δ-mem: Efficient Online Memory for Large Language Models
Summary
大语言模型在长期助手和智能体系统中越来越需要积累和复用历史信息。仅仅扩展上下文窗口成本高昂,且往往无法保证有效的上下文利用率。
我们提出了 δ-mem,这是一种轻量级的记忆机制,它通过一个紧凑的联想记忆在线状态(online state of associative memory),来增强被冻结的全注意力主干网络(frozen full-a...去小宇宙查看完整单集简介
前往小宇宙评论区与主播互动


【第635期】AI用十进制加法算日期
【第635期】AI用十进制加法算日期 episode artwork
Last Friday at 4:00 PM

Seventy3:借助NotebookLM的能力进行论文解读,专注人工智能、大模型、机器人算法、crypto方向,让大家跟着AI一起进步。
如果你想要解读自己的论文,获得更多曝光度。请联系小助手微信:seventy3_podcast 加群。
合作邮箱:zhiwudazhanjiangshi#gmail.com
今天的主题是:
Arithmetic in the Wild: Llama uses Base-10 Addition to Reason About Cyclic Concepts
Summary
表征中的结构是否意味着计算中的结构?
我们研究了 Llama-3.1-8B 如何在循环概念(cyclic concepts,例如“八月之后六个月是哪个月?”)上进行推理。
尽管 Llama-3.1-8B 对这些概念的表征在空间上呈现出循环结构,但我们发现,该模型并没有直接在循环概念的周期...去小宇宙查看完整单集简介
前往小宇宙评论区与主播互动


【第634期】Grep与向量检索在智能Agent搜索中的效能对比研究
【第634期】Grep与向量检索在智能Agent搜索中的效能对比研究 episode artwork
Last Thursday at 4:00 PM

Seventy3:借助NotebookLM的能力进行论文解读,专注人工智能、大模型、机器人算法、crypto方向,让大家跟着AI一起进步。
如果你想要解读自己的论文,获得更多曝光度。请联系小助手微信:seventy3_podcast 加群。
合作邮箱:zhiwudazhanjiangshi#gmail.com
今天的主题是:
Is Grep All You Need? How Agent Harnesses Reshape Agentic Search
Summary
大语言模型(LLM)智能体的最新进展已经实现了复杂的智能体工作流(agentic workflows),模型能够自主检索信息、调用工具并在大规模语料库上进行推理,从而代表用户完成任务。
尽管检索增强生成(RAG)在智能体搜索系统中的应用日益广泛,但现有文献仍缺乏对检索策略选择如何与智能体架构及工具调用范式相互作用的系统性比较...去小宇宙查看完整单集简介
前往小宇宙评论区与主播互动


【第633期】Lighthouse Attention重构长文本AI底层逻辑
【第633期】Lighthouse Attention重构长文本AI底层逻辑 episode artwork
Last Wednesday at 4:00 PM

Seventy3:借助NotebookLM的能力进行论文解读,专注人工智能、大模型、机器人算法、crypto方向,让大家跟着AI一起进步。
如果你想要解读自己的论文,获得更多曝光度。请联系小助手微信:seventy3_podcast 加群。
合作邮箱:zhiwudazhanjiangshi#gmail.com
今天的主题是:
Long Context Pre-Training with Lighthouse Attention
Summary
在极长序列长度下训练因果 Transformer(causal transformers)受到缩放点积注意力(SDPA)平方级时间和内存复杂度的瓶颈制约。在这项工作中,我们提出了 Lighthouse Attention,这是一种仅在训练阶段使用的、基于对称选择的分层注意力算法。它包裹在普通的 SDPA 周围,并且可以在训练接近尾声时轻松移除。我们的...去小宇宙查看完整单集简介
前往小宇宙评论区与主播互动


【第632期】大规模合成计算机长程办公模拟技术报告
【第632期】大规模合成计算机长程办公模拟技术报告 episode artwork
06/23/2026

Seventy3:借助NotebookLM的能力进行论文解读,专注人工智能、大模型、机器人算法、crypto方向,让大家跟着AI一起进步。
如果你想要解读自己的论文,获得更多曝光度。请联系小助手微信:seventy3_podcast 加群。
合作邮箱:zhiwudazhanjiangshi#gmail.com
今天的主题是:
Synthetic Computers at Scale for Long-Horizon Productivity Simulation
Summary
真实的长期生产力工作强烈依赖于用户特定的计算机环境,其中大部分的工作上下文是通过目录结构和内容丰富的工作产物来存储和组织的。为了扩展此类生产力场景的合成数据创建,我们引入了“规模化合成计算机”(Synthetic Computers at Scale)——这是一种可扩展的方法,用于创建具备逼真文件夹层级和丰富内容产...去小宇宙查看完整单集简介
前往小宇宙评论区与主播互动


【第631期】长程任务中的大模型训练:视界长度的实证研究
【第631期】长程任务中的大模型训练:视界长度的实证研究 episode artwork
06/22/2026

Seventy3:借助NotebookLM的能力进行论文解读,专注人工智能、大模型、机器人算法、crypto方向,让大家跟着AI一起进步。
如果你想要解读自己的论文,获得更多曝光度。请联系小助手微信:seventy3_podcast 加群。
合作邮箱:zhiwudazhanjiangshi#gmail.com
今天的主题是:
On Training Large Language Models for Long-Horizon Tasks: An Empirical Study of Horizon Length
Summary
大语言模型(LLM)作为交互式智能体,在通过长序列的环境交互来解决任务方面已经展现出巨大的潜力。尽管先前的研究主要集中在系统层面的优化或算法的改进上,但关于任务生命周期长度(Task horizon length)在塑造训练动力学方面所起的作用,目前仍知之甚少。
在...去小宇宙查看完整单集简介
前往小宇宙评论区与主播互动


【第630期】前沿代码智能体AlphaZero自主实现能力评估报告
【第630期】前沿代码智能体AlphaZero自主实现能力评估报告 episode artwork
06/21/2026

Seventy3:借助NotebookLM的能力进行论文解读,专注人工智能、大模型、机器人算法、crypto方向,让大家跟着AI一起进步。
如果你想要解读自己的论文,获得更多曝光度。请联系小助手微信:seventy3_podcast 加群。
合作邮箱:zhiwudazhanjiangshi#gmail.com
今天的主题是:
Frontier Coding Agents Can Now Implement an AlphaZero Self-Play Machine Learning Pipeline For Connect Four That Performs Comparably to an External Solver
Summary
预测人工智能(AI)系统何时能够切实加速 AI 自身的研究进程,是 AI 安全领域面临的核心挑战。现有的基准测试主要衡量广泛的能力增长,但可能无法为...去小宇宙查看完整单集简介
前往小宇宙评论区与主播互动


【第629期】HEAVYSKILL:大模型代理框架中的深思内化技术
【第629期】HEAVYSKILL:大模型代理框架中的深思内化技术 episode artwork
06/20/2026

Seventy3:借助NotebookLM的能力进行论文解读,专注人工智能、大模型、机器人算法、crypto方向,让大家跟着AI一起进步。
如果你想要解读自己的论文,获得更多曝光度。请联系小助手微信:seventy3_podcast 加群。
合作邮箱:zhiwudazhanjiangshi#gmail.com
今天的主题是:
HEAVYSKILL: Heavy Thinking as the Inner Skill in Agentic Harness
Summary
大语言模型(LLM)智能体测试基准环境(Agentic harness)的最新进展,结合了能够协调多个具备记忆、技能和工具调用能力的智能体的编排框架(Orchestration frameworks),在复杂推理任务中取得了显著成功。然而,真正驱动性能提升的底层机制,往往被掩盖在错综复杂的系统设计背后。
在本文中,我们提出了...去小宇宙查看完整单集简介
前往小宇宙评论区与主播互动


【第628期】OCR-Memory:基于光学上下文检索的长周期智能体记忆
【第628期】OCR-Memory:基于光学上下文检索的长周期智能体记忆 episode artwork
06/19/2026

Seventy3:借助NotebookLM的能力进行论文解读,专注人工智能、大模型、机器人算法、crypto方向,让大家跟着AI一起进步。
如果你想要解读自己的论文,获得更多曝光度。请联系小助手微信:seventy3_podcast 加群。
合作邮箱:zhiwudazhanjiangshi#gmail.com
今天的主题是:
OCR-Memory: Optical Context Retrieval for Long-Horizon Agent Memory
Summary
自主大语言模型(LLM)智能体越来越多地在长周期(Long-horizon)、交互式环境中运行,其成功取决于对长期历史中所积累经验的重复利用。然而,现有的智能体记忆系统从根本上受限于文本上下文预算:存储或重新访问原始轨迹(Raw trajectories)的 Token 成本高昂得令人望而却步,而摘要化和纯文本检索则是...去小宇宙查看完整单集简介
前往小宇宙评论区与主播互动


【第627期】内化多智能体辩论:潜空间推理与控制
【第627期】内化多智能体辩论:潜空间推理与控制 episode artwork
06/18/2026

Seventy3:借助NotebookLM的能力进行论文解读,专注人工智能、大模型、机器人算法、crypto方向,让大家跟着AI一起进步。
如果你想要解读自己的论文,获得更多曝光度。请联系小助手微信:seventy3_podcast 加群。
合作邮箱:zhiwudazhanjiangshi#gmail.com
今天的主题是:
Latent Agents: A Post-Training Procedure for Internalized Multi-Agent Debate
Summary
多智能体辩论(Multi-agent debate)已被证明能够提高大语言模型(LLM)的推理能力。然而,这种方法属于算力密集型,在回答问题之前需要生成冗长的对话记录(Transcripts)。
为了解决这一低效问题,我们开发了一个将多智能体辩论蒸馏(Distills)到单个 LLM 中的框架。该框架...去小宇宙查看完整单集简介
前往小宇宙评论区与主播互动


【第626期】SSL:智能体技能的调度-结构-逻辑表示法
【第626期】SSL:智能体技能的调度-结构-逻辑表示法 episode artwork
06/17/2026

Seventy3:借助NotebookLM的能力进行论文解读,专注人工智能、大模型、机器人算法、crypto方向,让大家跟着AI一起进步。
如果你想要解读自己的论文,获得更多曝光度。请联系小助手微信:seventy3_podcast 加群。
合作邮箱:zhiwudazhanjiangshi#gmail.com
今天的主题是:
From Skill Text to Skill Structure: The Scheduling-Structural-Logical Representation for Agent Skills
Summary
大语言模型(LLM)智能体正越来越多地依赖可重用技能(Reusable skills):即结合了指令、控制流、约束条件和工具调用的能力包。然而,在当前的智能体系统中,技能仍由重文本的伪影(Text-heavy artifacts)来表示——主要是 SK...去小宇宙查看完整单集简介
前往小宇宙评论区与主播互动


【第625期】OneManCompany:构建自组织的异构AI智能体企业
【第625期】OneManCompany:构建自组织的异构AI智能体企业 episode artwork
06/16/2026

Seventy3:借助NotebookLM的能力进行论文解读,专注人工智能、大模型、机器人算法、crypto方向,让大家跟着AI一起进步。
如果你想要解读自己的论文,获得更多曝光度。请联系小助手微信:seventy3_podcast 加群。
合作邮箱:zhiwudazhanjiangshi#gmail.com
今天的主题是:
From Skills to Talent: OrganisingHeterogeneous Agents asaReal-World Company
Summary
通过模块化技能与工具集成,单个智能体的能力已经取得了突飞猛进的发展,然而多智能体系统(MAS)仍受限于固定的团队结构、紧耦合的协同逻辑以及受限于会话周期的学习方式。我们认为,这反映了一个更深层次的缺失:缺乏一个原则性的组织层(Organisational layer)。该层应当能够解耦于单个智能体所掌握...去小宇宙查看完整单集简介
前往小宇宙评论区与主播互动


【第624期】可观察性驱动的编程智能体测试床自动演进
【第624期】可观察性驱动的编程智能体测试床自动演进 episode artwork
06/15/2026

Seventy3:借助NotebookLM的能力进行论文解读,专注人工智能、大模型、机器人算法、crypto方向,让大家跟着AI一起进步。
如果你想要解读自己的论文,获得更多曝光度。请联系小助手微信:seventy3_podcast 加群。
合作邮箱:zhiwudazhanjiangshi#gmail.com
今天的主题是:
Agentic Harness Engineering: Observability-Driven Automatic Evolution of Coding-Agent Harnesses
Summary
测试基准环境(Harnesses)目前已成为决定编码智能体(Coding-agent)性能的核心因素,它介导了模型与工具及执行环境之间的交互方式。然而,“基准环境工程”(Harness engineering)目前仍停留在手工制作阶段,因为实现其自动化面临着诸多挑...去小宇宙查看完整单集简介
前往小宇宙评论区与主播互动


【第623期】智能体世界模型:基础、能力与法则
【第623期】智能体世界模型:基础、能力与法则 episode artwork
06/14/2026

Seventy3:借助NotebookLM的能力进行论文解读,专注人工智能、大模型、机器人算法、crypto方向,让大家跟着AI一起进步。
如果你想要解读自己的论文,获得更多曝光度。请联系小助手微信:seventy3_podcast 加群。
合作邮箱:zhiwudazhanjiangshi#gmail.com
今天的主题是:
Agentic World Modeling: Foundations, Capabilities, Laws, and Beyond
Summary
随着人工智能系统从“文本生成”向“通过持续交互实现特定目标”演进,建模环境动力学(Environment dynamics)的能力正成为核心瓶颈。无论是操纵物体的具身智能体、导航软件的计算机智能体、与其他实体协同的社交智能体,还是设计实验的科学智能体,都需要具备预测性的环境模型;然而,“世界模型”(World mode...去小宇宙查看完整单集简介
前往小宇宙评论区与主播互动


【第622期】Dandelion++:具有形式化匿名保证的轻量级加密货币网络协议
【第622期】Dandelion++:具有形式化匿名保证的轻量级加密货币网络协议 episode artwork
06/13/2026

Seventy3:借助NotebookLM的能力进行论文解读,专注人工智能、大模型、机器人算法、crypto方向,让大家跟着AI一起进步。
如果你想要解读自己的论文,获得更多曝光度。请联系小助手微信:seventy3_podcast 加群。
合作邮箱:zhiwudazhanjiangshi#gmail.com
今天的主题是:
近期的研究表明,比特币的网络栈(Networking stack)中存在显著的匿名性漏洞。具体而言,目前的比特币交易广播机制允许第三方观察者将交易与其源 IP 地址进行关联。这为低成本、大规模的去匿名化攻击(Deanonymization attacks)奠定了基础。
在这项工作中,我们提出了 Dandelion++,这是一种针对大规模去匿名化攻击的初衷防御方案(First-principles defense),并具有接近最优的信息论安全保证。Dandelion++...去小宇宙查看完整单集简介
前往小宇宙评论区与主播互动


【第621期】多智能体大语言模型系统的多样性坍缩
【第621期】多智能体大语言模型系统的多样性坍缩 episode artwork
06/12/2026

Seventy3:借助NotebookLM的能力进行论文解读,专注人工智能、大模型、机器人算法、crypto方向,让大家跟着AI一起进步。
如果你想要解读自己的论文,获得更多曝光度。请联系小助手微信:seventy3_podcast 加群。
合作邮箱:zhiwudazhanjiangshi#gmail.com
今天的主题是:
Diversity Collapse in Multi-Agent LLM Systems: Structural Coupling and Collective Failure in Open-Ended Idea Generation
Summary
多智能体系统(MAS)越来越多地被用于开放式创意生成(Idea generation),其背后的驱动力在于人们期望集体交互能够拓宽探索的协同多样性。然而,这种协作究竟在何时以及为何能真正扩大解空间,目前仍不明确。
我...去小宇宙查看完整单集简介
前往小宇宙评论区与主播互动


【第620期】MASS-RAG:多智能体合成检索增强生成技术
【第620期】MASS-RAG:多智能体合成检索增强生成技术 episode artwork
06/11/2026

Seventy3:借助NotebookLM的能力进行论文解读,专注人工智能、大模型、机器人算法、crypto方向,让大家跟着AI一起进步。
如果你想要解读自己的论文,获得更多曝光度。请联系小助手微信:seventy3_podcast 加群。
合作邮箱:zhiwudazhanjiangshi#gmail.com
今天的主题是:
MASS-RAG: Multi-Agent Synthesis Retrieval-Augmented Generation
Summary
大语言模型(LLM)广泛应用于检索增强生成(RAG),以便在推理阶段融入外部知识。然而,当检索到的上下文包含噪声、不完整或异构(heterogeneous)时,单一的生成过程往往难以有效协调并融合这些证据。
为此,我们提出了 MASS-RAG,一种用于检索增强生成的多智能体合成方法(Multi-agent synthesis a...去小宇宙查看完整单集简介
前往小宇宙评论区与主播互动


【第619期】Learning Mechanics:大模型学习力学
【第619期】Learning Mechanics:大模型学习力学 episode artwork
06/10/2026

Seventy3:借助NotebookLM的能力进行论文解读,专注人工智能、大模型、机器人算法、crypto方向,让大家跟着AI一起进步。
如果你想要解读自己的论文,获得更多曝光度。请联系小助手微信:seventy3_podcast 加群。
合作邮箱:zhiwudazhanjiangshi#gmail.com
今天的主题是:
There Will Be a Scientific Theory of Deep Learning
Summary
在这篇论文中,我们论证了深度学习科学理论正在浮现。我们所说的理论,是指一种能够表征神经网络训练过程、隐藏表示、最终权重以及性能等重要属性与统计特征的理论。我们汇集了当前深度学习理论研究的主要方向,并确定了指向该理论的五个不断壮大的研究领域:
* (a) 可解的理想化设置:为现实系统中的学习动力学提供直观理解;
* (b) 可微解的极限(可积极限):揭示...去小宇宙查看完整单集简介
前往小宇宙评论区与主播互动


【第618期】无状态决策记忆:企业级AI智能体架构
【第618期】无状态决策记忆:企业级AI智能体架构 episode artwork
06/09/2026

Seventy3:借助NotebookLM的能力进行论文解读,专注人工智能、大模型、机器人算法、crypto方向,让大家跟着AI一起进步。
如果你想要解读自己的论文,获得更多曝光度。请联系小助手微信:seventy3_podcast 加群。
合作邮箱:zhiwudazhanjiangshi#gmail.com
今天的主题是:
Stateless Decision Memory for Enterprise AI Agents
Summary
在受监管领域(如保险核保、理赔裁决、税务稽查)中,企业级长周期决策智能体的部署目前仍由检索增强管道(Retrieval-augmented pipelines,即 RAG)主导,尽管过去十年中涌现出了越来越多尖端的有状态记忆架构(Stateful memory architectures)。我们认为,这反映了一个隐藏的核心需求:受监管领域的部署高度依赖...去小宇宙查看完整单集简介
前往小宇宙评论区与主播互动


【第617期】自动演化EDA工具:多智能体自进化ABC
【第617期】自动演化EDA工具:多智能体自进化ABC episode artwork
06/08/2026

Seventy3:借助NotebookLM的能力进行论文解读,专注人工智能、大模型、机器人算法、crypto方向,让大家跟着AI一起进步。
如果你想要解读自己的论文,获得更多曝光度。请联系小助手微信:seventy3_podcast 加群。
合作邮箱:zhiwudazhanjiangshi#gmail.com
今天的主题是:
Autonomous Evolution of EDA Tools: Multi-Agent Self-Evolved ABC
Summary
本文提出了首个自进化逻辑综合框架,该框架利用大语言模型(LLM)智能体自主改进广为采用的逻辑综合系统 \textsc{ABC} 的源代码。我们的框架直接作用于整个集成 ABC 代码库,输出的代码仓库保持其单二进制执行模型和命令行接口不变。在初始进化周期中,我们使用现有的开源综合组件进行系统引导,涵盖流程调优、逻辑最小化与工艺映...去小宇宙查看完整单集简介
前往小宇宙评论区与主播互动


【第616期】原生智能:通向自主演化智能体的元学习范式
【第616期】原生智能:通向自主演化智能体的元学习范式 episode artwork
06/07/2026

Seventy3:借助NotebookLM的能力进行论文解读,专注人工智能、大模型、机器人算法、crypto方向,让大家跟着AI一起进步。
如果你想要解读自己的论文,获得更多曝光度。请联系小助手微信:seventy3_podcast 加群。
合作邮箱:zhiwudazhanjiangshi#gmail.com
今天的主题是:
Training LLM Agents for Spontaneous, Reward-Free Self-Evolution via World Knowledge Exploration
Summary
当今大多数智能体(agent)通过遵循人类定义的奖励和规则来“自我进化”。然而,这一过程从根本上仍高度依赖外部监督;一旦失去人类指导,进化便会停止。在本工作中,我们训练智能体具备内在的元进化能力,使其能够在执行任务前自发地学习未知环境。为了赋予这种能力,我们设计了...去小宇宙查看完整单集简介
前往小宇宙评论区与主播互动


【第615期】Skill-RAG:基于状态探测与技能路由的检索增强生成
【第615期】Skill-RAG:基于状态探测与技能路由的检索增强生成 episode artwork
06/06/2026

Seventy3:借助NotebookLM的能力进行论文解读,专注人工智能、大模型、机器人算法、crypto方向,让大家跟着AI一起进步。
如果你想要解读自己的论文,获得更多曝光度。请联系小助手微信:seventy3_podcast 加群。
合作邮箱:zhiwudazhanjiangshi#gmail.com
今天的主题是:
Skill-RAG: Failure-State-Aware Retrieval Augmentation via Hidden-State Probing and Skill Routing
Summary
检索增强生成(Retrieval-Augmented Generation,RAG)已成为将大型语言模型 grounding 在外部知识上的基础范式。虽然自适应检索机制已提升了检索效率,但现有方法将检索后失败视为“重试信号”而非诊断信号——导致查询与证据之间的结...去小宇宙查看完整单集简介
前往小宇宙评论区与主播互动


【第614期】从Attention到Mamba:跨架构蒸馏方案
【第614期】从Attention到Mamba:跨架构蒸馏方案 episode artwork
06/05/2026

Seventy3:借助NotebookLM的能力进行论文解读,专注人工智能、大模型、机器人算法、crypto方向,让大家跟着AI一起进步。
如果你想要解读自己的论文,获得更多曝光度。请联系小助手微信:seventy3_podcast 加群。
合作邮箱:zhiwudazhanjiangshi#gmail.com
今天的主题是:
Attention to Mamba: A Recipe for Cross-Architecture Distillation
Summary
状态空间模型(State Space Models, SSMs),例如 Mamba,由于相比基于注意力机制(Attention-based)的模型在生成阶段具有更低的内存消耗和更高的吞吐效率,近年来成为 Transformer 的一种流行替代方案。
另一方面,社区已经积累了大量关于 Transformer 训练的经验,并且有...去小宇宙查看完整单集简介
前往小宇宙评论区与主播互动


【第613期】Autogenesis:A Self-Evolving Agent Protocol
【第613期】Autogenesis:A Self-Evolving Agent Protocol episode artwork
06/04/2026

Seventy3:借助NotebookLM的能力进行论文解读,专注人工智能、大模型、机器人算法、crypto方向,让大家跟着AI一起进步。
如果你想要解读自己的论文,获得更多曝光度。请联系小助手微信:seventy3_podcast 加群。
合作邮箱:zhiwudazhanjiangshi#gmail.com
今天的主题是:
Autogenesis: A Self-Evolving Agent Protocol
Summary
近年来,基于 LLM 的智能体系统在解决复杂的长时程任务方面展现出一定潜力。然而,现有智能体协议(例如 A2A 和 MCP)在跨实体生命周期与上下文管理、版本追踪以及具备演化安全性的更新接口方面定义不足,这种不足倾向于促成单体式组合架构,并导致脆弱的“胶水代码”设计。
为此,我们提出 Autogenesis Protocol(AGP),一种自演化协议,其核心思想是将...去小宇宙查看完整单集简介
前往小宇宙评论区与主播互动


【第612期】DeepSeek-V4:高效百万长度上下文智能语言模型
【第612期】DeepSeek-V4:高效百万长度上下文智能语言模型 episode artwork
06/03/2026

Seventy3:借助NotebookLM的能力进行论文解读,专注人工智能、大模型、机器人算法、crypto方向,让大家跟着AI一起进步。
如果你想要解读自己的论文,获得更多曝光度。请联系小助手微信:seventy3_podcast 加群。
合作邮箱:zhiwudazhanjiangshi#gmail.com
今天的主题是:
DeepSeek-V4: Towards Highly Efficient Million-Token Context Intelligence
Summary
我们提出 DeepSeek-V4 系列的预览版本,包括两款强大的混合专家(Mixture-of-Experts, MoE)语言模型:
* DeepSeek-V4-Pro:1.6T 参数(其中 49B 参数在推理时激活)
* DeepSeek-V4-Flash:284B 参数(其中 13B 参数在推理时激活)
...去小宇宙查看完整单集简介
前往小宇宙评论区与主播互动


【第611期】WebXSkill:面向自主网络智能体的可执行技能框架
【第611期】WebXSkill:面向自主网络智能体的可执行技能框架 episode artwork
06/02/2026

Seventy3:借助NotebookLM的能力进行论文解读,专注人工智能、大模型、机器人算法、crypto方向,让大家跟着AI一起进步。
如果你想要解读自己的论文,获得更多曝光度。请联系小助手微信:seventy3_podcast 加群。
合作邮箱:zhiwudazhanjiangshi#gmail.com
今天的主题是:
WEBXSKILL: Skill Learning for Autonomous Web Agents
Summary
基于大型语言模型(LLM)的自主网页智能体在执行复杂浏览器任务方面已展现出潜力,但在长时程(long-horizon)工作流上仍然存在明显困难。
一个关键瓶颈在于现有“技能(skill)”表示方式中的 grounding gap(落地鸿沟):
* 文本形式的 workflow skills 虽然具备自然语言层面的指导性,但无法直接执行;
* 基于代码...去小宇宙查看完整单集简介
前往小宇宙评论区与主播互动


【第610期】潜意识学习:大模型通过隐性信号传递行为特征
【第610期】潜意识学习:大模型通过隐性信号传递行为特征 episode artwork
06/01/2026

Seventy3:借助NotebookLM的能力进行论文解读,专注人工智能、大模型、机器人算法、crypto方向,让大家跟着AI一起进步。
如果你想要解读自己的论文,获得更多曝光度。请联系小助手微信:seventy3_podcast 加群。
合作邮箱:zhiwudazhanjiangshi#gmail.com
今天的主题是:
Language models transmit behavioural traits through hidden signals in data
Summary
我们研究了一种被称为“潜隐学习(subliminal learning)”的惊人现象:语言模型能够通过语义上毫不相关的数据传递行为特征。
在我们的主要实验中,一个具有某种特征 T 的“教师”模型(例如喜欢猫头鹰,或存在对齐问题)会生成一个仅由数字序列构成的数据集。令人惊讶的是,一个在该数据集上训练的“学生...去小宇宙查看完整单集简介
前往小宇宙评论区与主播互动


【第609期】Auto-Diagnose:基于大语言模型的谷歌集成测试故障自动诊断
【第609期】Auto-Diagnose:基于大语言模型的谷歌集成测试故障自动诊断 episode artwork
05/31/2026

Seventy3:借助NotebookLM的能力进行论文解读,专注人工智能、大模型、机器人算法、crypto方向,让大家跟着AI一起进步。
如果你想要解读自己的论文,获得更多曝光度。请联系小助手微信:seventy3_podcast 加群。
合作邮箱:zhiwudazhanjiangshi#gmail.com
今天的主题是:
LLM-Based Automated Diagnosis Of Integration Test Failures At Google
Summary
集成测试(integration testing)对于复杂软件系统的质量与可靠性至关重要。然而,由于其生成的日志具有海量、非结构化以及异构等特点,故障诊断面临巨大挑战。这些问题导致开发者需要承受很高的认知负担,日志中的信噪比极低,使诊断过程困难且耗时。
开发者长期以来持续抱怨这些困难,并表示,相较于单元测试失败,他们...去小宇宙查看完整单集简介
前往小宇宙评论区与主播互动


【第608期】记忆迁移学习:编程代理的跨域经验共享
【第608期】记忆迁移学习:编程代理的跨域经验共享 episode artwork
05/30/2026

Seventy3:借助NotebookLM的能力进行论文解读,专注人工智能、大模型、机器人算法、crypto方向,让大家跟着AI一起进步。
如果你想要解读自己的论文,获得更多曝光度。请联系小助手微信:seventy3_podcast 加群。
合作邮箱:zhiwudazhanjiangshi#gmail.com
今天的主题是:
Memory Transfer Learning: How Memories are Transferred Across Domains in Coding Agents
Summary
基于记忆的自我进化(memory-based self-evolution)已成为代码智能体(coding agents)中的一种有前景的范式。然而,现有方法通常将记忆的使用限制在同质化任务领域中,未能充分利用现实世界中不同编程问题之间共享的基础设施基础,例如运行时环境和编程语言。...去小宇宙查看完整单集简介
前往小宇宙评论区与主播互动


【第607期】AlphaEval:生产环境下的AI智能体综合评估基准
【第607期】AlphaEval:生产环境下的AI智能体综合评估基准 episode artwork
05/29/2026

Seventy3:借助NotebookLM的能力进行论文解读,专注人工智能、大模型、机器人算法、crypto方向,让大家跟着AI一起进步。
如果你想要解读自己的论文,获得更多曝光度。请联系小助手微信:seventy3_podcast 加群。
合作邮箱:zhiwudazhanjiangshi#gmail.com
今天的主题是:
AlphaEval: Evaluating Agents in Production
Summary
AI 智能体在商业场景中的快速部署,已经超过了能够真实反映生产环境的评测方法的发展速度。现有基准测试通常通过事后整理(retrospectively curated)的任务来衡量智能体能力,这些任务具有明确规定的需求和确定性的评价指标——而这些条件与真实生产环境存在根本差异。
在实际生产环境中:
* 需求往往包含隐含约束;
* 输入是异构的多模态文档,且信息分散于多个...去小宇宙查看完整单集简介
前往小宇宙评论区与主播互动


【第606期】AiScientist:基于文件总线协议的自主长程机器学习科研系统
【第606期】AiScientist:基于文件总线协议的自主长程机器学习科研系统 episode artwork
05/28/2026

Seventy3:借助NotebookLM的能力进行论文解读,专注人工智能、大模型、机器人算法、crypto方向,让大家跟着AI一起进步。
如果你想要解读自己的论文,获得更多曝光度。请联系小助手微信:seventy3_podcast 加群。
合作邮箱:zhiwudazhanjiangshi#gmail.com
今天的主题是:
Toward Autonomous Long-Horizon Engineering for ML Research
Summary
自主 AI 研究近年来取得了快速进展,但面向机器学习(ML)研究工程的长时程(long-horizon)任务仍然极具挑战:智能体必须在数小时甚至数天内,持续在任务理解、环境搭建、实现、实验以及调试等多个阶段之间保持连贯推进。
我们提出了 AiScientist,一个用于自主长时程 ML 研究工程的系统,其建立在一个简单原则之上:强大的长...去小宇宙查看完整单集简介
前往小宇宙评论区与主播互动


【第605期】RUBICON:一种数据中心化的代理式AI架构
【第605期】RUBICON:一种数据中心化的代理式AI架构 episode artwork
05/27/2026

Seventy3:借助NotebookLM的能力进行论文解读,专注人工智能、大模型、机器人算法、crypto方向,让大家跟着AI一起进步。
如果你想要解读自己的论文,获得更多曝光度。请联系小助手微信:seventy3_podcast 加群。
合作邮箱:zhiwudazhanjiangshi#gmail.com
今天的主题是:
An Alternate Agentic AI Architecture (It's About the Data)
Summary
过去几年里,“Agentic AI(智能体 AI)”领域的主流叙事一直认为:大型语言模型应当通过动态选择工具、发起子查询并综合结果来协调信息访问。我们认为,这种方法存在根本性误导:企业真正面临的并不是“推理能力不足”,而是“数据集成问题”。
企业本质上是以数据为中心的。关键数据分散在异构系统之中(例如数据库、文档和外部服务),每个系统都...去小宇宙查看完整单集简介
前往小宇宙评论区与主播互动


【第604期】金融智能体:自主语言模型交易的安全性体系架构
【第604期】金融智能体:自主语言模型交易的安全性体系架构 episode artwork
05/26/2026

Seventy3:借助NotebookLM的能力进行论文解读,专注人工智能、大模型、机器人算法、crypto方向,让大家跟着AI一起进步。
如果你想要解读自己的论文,获得更多曝光度。请联系小助手微信:seventy3_podcast 加群。
合作邮箱:zhiwudazhanjiangshi#gmail.com
今天的主题是:
SoK: Security of Autonomous LLM Agents in Agentic Commerce
Summary
像 OpenClaw 这样的自主大型语言模型(LLM)智能体,正推动智能体商业(agentic commerce)从“由人类监督的辅助系统”演变为能够自主协商、购买服务、管理数字资产,并在链上与链下环境中执行交易的机器行为主体。诸如 Trustless Agents 标准(ERC-8004)、Agent Payments Protoco...去小宇宙查看完整单集简介
前往小宇宙评论区与主播互动


【第603期】惯性挖矿:比特币协议的均衡实现
【第603期】惯性挖矿:比特币协议的均衡实现 episode artwork
05/25/2026

Seventy3:借助NotebookLM的能力进行论文解读,专注人工智能、大模型、机器人算法、crypto方向,让大家跟着AI一起进步。
如果你想要解读自己的论文,获得更多曝光度。请联系小助手微信:seventy3_podcast 加群。
合作邮箱:zhiwudazhanjiangshi#gmail.com
今天的主题是:
Inertial Mining: Equilibrium Implementation of the Bitcoin Protocol
Summary
工作量证明(Proof-of-Work)加密货币的价值,关键取决于矿工是否有动力遵循协议。然而,由 Nakamoto(2008)提出并在实践中实现的比特币挖矿协议,早已被证明并不构成一个均衡:Eyal 与 Sirer(2018)提出了一种名为“自私挖矿(selfish mining)”的有利偏离策略,其核心在于矿工会战...去小宇宙查看完整单集简介
前往小宇宙评论区与主播互动


【第602期】AGNT2:面向自主智能体经济的二层网络架构
【第602期】AGNT2:面向自主智能体经济的二层网络架构 episode artwork
05/24/2026

Seventy3:借助NotebookLM的能力进行论文解读,专注人工智能、大模型、机器人算法、crypto方向,让大家跟着AI一起进步。
如果你想要解读自己的论文,获得更多曝光度。请联系小助手微信:seventy3_podcast 加群。
合作邮箱:zhiwudazhanjiangshi#gmail.com
今天的主题是:
AGNT2: AutonomousAgent Economieson Interaction-Optimized Layer2 Infrastructure
Summary
当前的区块链二层(Layer 2)解决方案,包括 Optimism、Arbitrum、zkSync 及其衍生系统,主要针对由人类发起的金融交易进行优化。而自主 AI 智能体之间产生的,则是高频率、语义丰富、且发生于彼此互不信任主体之间的服务调用。现有链将这些交互视为通用 calldata 处理,迫...去小宇宙查看完整单集简介
前往小宇宙评论区与主播互动


【第601期】ClawCoin:面向去中心化智能体经济的AI原生加密货币
【第601期】ClawCoin:面向去中心化智能体经济的AI原生加密货币 episode artwork
05/23/2026

Seventy3:借助NotebookLM的能力进行论文解读,专注人工智能、大模型、机器人算法、crypto方向,让大家跟着AI一起进步。
如果你想要解读自己的论文,获得更多曝光度。请联系小助手微信:seventy3_podcast 加群。
合作邮箱:zhiwudazhanjiangshi#gmail.com
今天的主题是:
ClawCoin: An Agentic AI-Native Cryptocurrency for Decentralized Agent Economies
Summary
自主 AI 智能体的生存完全取决于其消耗的 API Token:如果没有付费的推理能力,它们就无法进行推理、执行行动或委派任务。计算 Token 成本已成为新兴智能体经济中的核心约束资源,但这种资源却不可转移:它绑定于账户、依赖于特定供应商,并且不存在于链上账本中。现有的支付协议(如 x402)...去小宇宙查看完整单集简介
前往小宇宙评论区与主播互动


【第600期】层级交织:Moltbook中的代币经济与智能体话语
【第600期】层级交织:Moltbook中的代币经济与智能体话语 episode artwork
05/22/2026

Seventy3:借助NotebookLM的能力进行论文解读,专注人工智能、大模型、机器人算法、crypto方向,让大家跟着AI一起进步。
如果你想要解读自己的论文,获得更多曝光度。请联系小助手微信:seventy3_podcast 加群。
合作邮箱:zhiwudazhanjiangshi#gmail.com
今天的主题是:
The Platform Is Mostly Not a Platform: Token Economies and Agent Discourse on Moltbook
Summary
Moltbook 是一个面向 AI 智能体的 Reddit 风格社交平台,于 2026 年 1 月上线。在上线后的前两个月内,该平台已吸引超过 230 万条帖子和 1400 万条评论。我们分析了一个覆盖 61 天的数据集,其中包含 219 万条帖子、1125 万条评论以及 175,...去小宇宙查看完整单集简介
前往小宇宙评论区与主播互动