AI日报头条|大语言模型精选人工智能资讯

40 Episodes
Subscribe

By: AI布正经

️ 【重要停更公告】 本播客将于 6月1日 起正式停更,感谢听众朋友们的厚爱!我跑去做了一件更好玩的事:开发了一款“AI每日新闻 Skill”,并开启了全新的公众号【AI布正经】。如果你受够了低效的 AI 资讯获取方式,或者想了解如何让你的智能体更聪明,微信搜索并关注公众号【AI布正经】,我们在那里不见不散!用AI技术,重塑自媒体每天自动抓取全球最重要的数百条AI资讯!大语言模型(LLM)智能分析,为你高效呈现30条最重要的人工智能资讯头条。涵盖AI行业动态、技术突破、产业应用、投融资事件等热点,内容权威、精选、快人一步。无论你是科技爱好者、从业者,还是关注AI前沿趋势的投资人、创业者,这里都是你获取人工智能核心资讯的首选。每天只需20分钟,快速了解AI领域最新进展,节省筛选信息的时间,专注最有价值的内容。亮点功能:> LLM大语言模型自动精选,更精准、更智能> 只讲重点,拒绝信息冗余,真正高效> 全面覆盖AI技术、产业、应用、资本等板块> 每天持续更新,永远站在AI行业前沿

✂️ Clip this podcast
AI布正经-特别篇
#1
06/01/2026

感谢大家一路以来的陪伴。有你们的支持真好。


AI日报20260531
#2
05/30/2026

过去 24 小时,我们从全球权威来源自动抓取 105 条 AI 资讯,经大语言模型分析与去重,精选 16 条核心要闻,覆盖行业动态、技术突破、产业应用与投融资。

* 如需查看全部资讯,请在评论区留言「全部」,我们将提供当期全量资讯合集(含来源链接)。 *

* 我们的使命:为您节约时间。 *


==========================================================

** 【 今日要闻速览 】 **

• [Sysdig 捕获首例针对 AWS 数据库的实时大语言模型攻击 | AI 周报](https://aiweekly.co/alerts/sysdig-catches-first-live-llm-attack-on-aws-database)

网络安全公司 Sysdig 捕获了首例利用大语言模型智能体发起的实时攻击。 攻击者利用一个已知漏洞进入云环境,然后把窃取的 AWS 凭证直接喂给了 AI 智能体。 这个智能体在不到一小时内,自主完成了四次横向移动…


• [安东尼奥·贝拉尔迪梳理了33种常见的大语言模型输出偏差 | AI周报](https://aiweekly.co/alerts/antonio-berardi-maps-33-recurring-llm-output-distortions)

一位名叫安东尼奥·贝拉尔迪的研究员,在Zenodo上发布了一份新报告。 他梳理出了33种大语言模型反复出现的输出偏差,并给它们都起了名字。 这些偏差包括“谄媚压缩”和“回避寄生”等…


• [英伟达清华团队提出Gamma-World:世界模型从「一个人玩」到「多人共处」 – 量子位](https://www.qbitai.com/2026/05/426662.html)

英伟达和清华等机构最近发布了一个叫Gamma-World的新模型。 它解决了一个关键问题:让AI世界模型从支持一个人,变成支持多个人同时在线互动。 过去的世界模型,只能预测单个玩家的视角…


===================================


AI日报20260530
#3
05/29/2026

过去 24 小时,我们从全球权威来源自动抓取 148 条 AI 资讯,经大语言模型分析与去重,精选 16 条核心要闻,覆盖行业动态、技术突破、产业应用与投融资。

* 如需查看全部资讯,请在评论区留言「全部」,我们将提供当期全量资讯合集(含来源链接)。 *

* 我们的使命:为您节约时间。 *


==========================================================

** 【 今日要闻速览 】 **

• [Apollo 支持为 Anthropic TPU 提供 360 亿美元创纪录债务交易 | AI 周报](https://aiweekly.co/alerts/apollo-backs-36b-record-debt-deal-for-anthropic-tpus)

阿波罗和黑石正在推动一笔360亿美元的私人信贷交易。 这笔钱将用来购买谷歌的TPU芯片,然后租给AI公司Anthropic。 TPU是谷歌专门为AI训练设计的芯片,可以理解为AI的专用引擎…


• [Anthropic的年化收入达到470亿美元](https://simonwillison.net/2026/May/29/anthropic/)

人工智能公司Anthropic在最新一轮650亿美元融资中透露,它的年化经常性收入已经达到470亿美元。 年化经常性收入,就是用最近一个月的收入乘以12,推算出的全年收入。 今年2月,这个数字还是140亿美元…


• [清华系团队给大模型织了一张“智能算力电网” – 量子位](https://www.qbitai.com/2026/05/426353.html)

一家清华系创业公司,正在解决AI芯片大量闲置的问题。 他们叫是石科技,目标是让国产算力真正用起来。 这家公司成立于2021年,核心团队来自清华和国家级超算中心…


==========================================================


AI日报20260529
#4
05/28/2026

过去 24 小时,我们从全球权威来源自动抓取 154 条 AI 资讯,经大语言模型分析与去重,精选 17 条核心要闻,覆盖行业动态、技术突破、产业应用与投融资。

* 如需查看全部资讯,请在评论区留言「全部」,我们将提供当期全量资讯合集(含来源链接)。 *

* 我们的使命:为您节约时间。 *


==========================================================

** 【 今日要闻速览 】 **

• [Jasper AI 发布1.05亿图像开放视觉数据集 | AI周报](https://aiweekly.co/alerts/jasper-ai-releases-105m-image-open-vision-dataset)

Jasper AI 发布了一个大型开放视觉数据集,叫 MONET。 它包含 1 亿 490 万张图像和对应的文字描述。 这个数据集来自 29 亿张原始图片,经过自动筛选,只留下高质量配对…


• [Anthropic发布Opus 4.8,配备全新“动态工作流”工具 | TechCrunch](https://techcrunch.com/2026/05/28/anthropic-releases-opus-4-8-with-new-dynamic-workflow-tool/)

人工智能公司Anthropic发布了最新模型Opus 4.8。 距离上一版本只有41天,升级速度比以往快很多。 这次快速更新,可能和Opus 4.7用户反响冷淡有关…


• [7B打败o3、GPT-5!医学AI智能体让模型学会“看哪里、怎么看” – 量子位](https://www.qbitai.com/2026/05/426150.html)

医学AI正在经历一次关键转变。 过去的多模态模型,看一张影像后直接生成答案,但容易看错区域或漏掉病灶。 现在,上海创智学院团队联合多所高校,提出了新的思路…


==========================================================


AI日报20260528
#5
05/27/2026

过去 24 小时,我们从全球权威来源自动抓取 134 条 AI 资讯,经大语言模型分析与去重,精选 16 条核心要闻,覆盖行业动态、技术突破、产业应用与投融资。

* 如需查看全部资讯,请在评论区留言「全部」,我们将提供当期全量资讯合集(含来源链接)。 *

* 我们的使命:为您节约时间。 *


==========================================================

** 【 今日要闻速览 】 **

• [前谷歌和苹果研究员创立初创公司,构建AI缺失的反馈循环 | 《连线》](https://www.wired.com/story/ex-google-apple-ai-researchers-want-to-make-ai-that-gets-smarter-as-you-use-it/)

一群来自谷歌DeepMind、苹果和OpenAI的研究员,最近成立了一家新公司,叫Trajectory。 他们想解决AI领域一个关键问题:模型训练完就停止变聪明了。 目前,像OpenAI和谷歌的AI,在编程和数学上很强,但不会从日常错误中学习…


• [Gemma 4 多词元预测:生成速度最高提升约 3 倍 - InfoQ](https://www.infoq.cn/article/vduuUvpVw0FiIcplFtGd)

谷歌发布了新一代模型Gemma 4,它的一项关键技术叫多词元预测,能把生成速度提升约三倍。 简单来说,大模型生成文字时,每次只能输出一个词,就像一个字一个字地打字。 而多词元预测让模型能一次预测多个词,再快速验证,速度自然就快了…


• [ITBench-AA:前沿模型在首个企业IT任务代理基准测试中得分低于50%——由Artificial Analysis与IBM联合发布](https://huggingface.co/blog/ibm-research/itbench-aa)

人工智能领域最近有了一个新基准测试,叫ITBench-AA。 它专门测试前沿模型在企业IT任务中的表现,结果所有模型得分都低于百分之五十。 这个基准测试由Artificial Analysis和IBM联合推出…



AI日报20260527
#6
05/26/2026

过去 24 小时,我们从全球权威来源自动抓取 124 条 AI 资讯,经大语言模型分析与去重,精选 15 条核心要闻,覆盖行业动态、技术突破、产业应用与投融资。

* 如需查看全部资讯,请在评论区留言「全部」,我们将提供当期全量资讯合集(含来源链接)。 *

* 我们的使命:为您节约时间。 *


==========================================================

** 【 今日要闻速览 】 **

• [中国国家发改委将大语言模型部署与国产芯片挂钩 | AI周报](https://aiweekly.co/alerts/china-ndrc-ties-llm-deployment-to-domestic-chips)

中国国家发改委在5月22号发布了一项新指令。 要求国内AI企业,必须把大语言模型和国产芯片配对使用。 阿里巴巴、百度和字节跳动是这次的主要目标…


• [不止于Copilot:医渡科技超级智能体,想做医疗界的Claude Code | 极客公园](https://www.geekpark.net/news/364838)

医渡科技发布了一套医疗超级智能体系统,目标是在医疗领域实现类似Claude Code在软件工程中的变革。 Claude Code让AI从对话工具变成了能端到端执行任务的“同事”,医渡科技想把这个模式搬进医院。 但医疗和写代码完全不同,容错率极低,医生必须对每个决策负责…


• [刚刚,国产AI自己造了AI,全球首例! – 量子位](https://www.qbitai.com/2026/05/425511.html)

国产AI现在能自己造AI了。 面壁智能刚刚发布了一个全球首例。 他们让AI自己写出了一套大模型预训练框架,叫ForgeTrain…


==========================================================


AI日报20260527
#7
05/26/2026

过去 24 小时,我们从全球权威来源自动抓取 120 条 AI 资讯,经大语言模型分析与去重,精选 18 条核心要闻,覆盖行业动态、技术突破、产业应用与投融资。

* 如需查看全部资讯,请在评论区留言「全部」,我们将提供当期全量资讯合集(含来源链接)。 *

* 我们的使命:为您节约时间。 *


==========================================================

** 【 今日要闻速览 】 **

• [人类56年解不出,谷歌AI一夜连破9道世纪难题-36氪](https://www.36kr.com/p/3824591715094914)

谷歌DeepMind发布了一个新的AI数学智能体,叫AlphaProof Nexus。 它一口气解决了九道悬而未决几十年的数学难题。 其中最老的一道,已经困扰了数学家整整五十六年…


• [Anthropic泄露事件为开源开发者提供Claude蓝图 | AI周报](https://aiweekly.co/alerts/anthropic-leak-gives-open-source-devs-claude-blueprint)

Anthropic 的 Claude Code 源代码疑似泄露,超过五十万行代码被公开。 这意味着开源开发者可能拿到了一份内部蓝图,能大幅缩短复制其功能的时间。 这次泄露发生在三月三十一号,据称包含后端逻辑和代理框架架构…


• [Zenodo论文:代码库图使LLM令牌使用量增加54% | AI周报](https://aiweekly.co/alerts/zenodo-paper-codebase-graphs-raise-llm-token-use-54)

一项新研究发现,给AI编码助手提供代码库的结构图,反而会让它消耗更多计算资源。 这项来自Zenodo的研究,在包含三千多个文件的编程项目中做了测试。 结果发现,有了结构图之后,AI每完成一个任务,消耗的令牌数量增加了百分之五十四…


======================================


AI日报20260526
#8
05/25/2026

过去 24 小时,我们从全球权威来源自动抓取 38 条 AI 资讯,经大语言模型分析与去重,精选 10 条核心要闻,覆盖行业动态、技术突破、产业应用与投融资。

* 如需查看全部资讯,请在评论区留言「全部」,我们将提供当期全量资讯合集(含来源链接)。 *

* 我们的使命:为您节约时间。 *


==========================================================

** 【 今日要闻速览 】 **

• [TrapDoor 利用AI配置文件攻击npm和PyPI | AI周报](https://aiweekly.co/alerts/trapdoor-poisons-npm-pypi-with-ai-config-file-attack)

一种新型的供应链攻击正在利用AI编码工具的配置文件。 攻击者把恶意指令藏在了开发者几乎不会检查的地方。 这次攻击名叫TrapDoor,同时攻陷了npm、PyPI和Crates.io三大软件仓库…


• [LangChain与CrewAI缺乏智能体承诺追踪层 | AI周报](https://aiweekly.co/alerts/langchain-and-crewai-miss-agent-promise-tracking-layer)

智能体框架LangChain和CrewAI,都缺少一个关键功能:追踪智能体对用户做出的有时限承诺。 开发者把这种故障称为“承诺漂移”。 简单说,智能体在对话中答应了一件事,比如“明天下午三点发邮件”,但会话结束后,这个承诺就消失了…


• [大规模工程支撑场景下的多智能体系统设计:Grab 实践案例 - InfoQ](https://www.infoq.cn/article/7DfZeiQH0zm08P88xIw9)

东南亚出行平台 Grab 的工程师们,最近用多智能体系统给自己减了负。 这套系统专门处理数据平台的日常运维,比如排查故障、调试 SQL 语句。 Grab 的数据平台服务超过一千名内部用户,管理着一万五千多张数据表…


=================


AI日报20260524
#9
05/24/2026

过去 24 小时,我们从全球权威来源自动抓取 117 条 AI 资讯,经大语言模型分析与去重,精选 15 条核心要闻,覆盖行业动态、技术突破、产业应用与投融资。

* 如需查看全部资讯,请在评论区留言「全部」,我们将提供当期全量资讯合集(含来源链接)。 *

* 我们的使命:为您节约时间。 *


==========================================================

** 【 今日要闻速览 】 **

• [Cohere 在 Apache 2.0 协议下开源 218B 参数 Command A+ 模型 | AI 周报](https://aiweekly.co/alerts/cohere-open-sources-218b-command-a-under-apache-20)

Cohere 公司最近开源了一款名为 Command A+ 的大型人工智能模型。 这款模型拥有两千一百八十亿个参数,但只需要两块英伟达 H100 显卡就能运行。 过去,这么大的模型通常需要四块甚至更多显卡…


• [Gemini 网络代理遭遇蜜罐注入攻击 | AI 周报](https://aiweekly.co/alerts/gemini-web-agent-follows-honeypot-injection-attack)

一名安全研究人员用蜜罐页面成功骗过了谷歌的Gemini网络代理。 这个代理毫无抵抗地执行了网页里隐藏的恶意指令。 所谓蜜罐,就是故意设置的陷阱网页…


• [Qwen3 35B MoE 在8GB GPU上实现262k上下文 | AI周报](https://aiweekly.co/alerts/qwen3-35b-moe-hits-262k-context-on-8gb-gpu)

一张八GB的消费级显卡,现在能跑起以前需要专业设备才能处理的大模型任务。 这是本周在本地大模型社区里引起关注的一个测试结果。 测试用的是阿里巴巴的Qwen3模型,总参数量是35B,但采用了混合专家架构,推理时只激活其中约3B的参数…


============


AI日报20260523
#10
05/23/2026

过去 24 小时,我们从全球权威来源自动抓取 173 条 AI 资讯,经大语言模型分析与去重,精选 15 条核心要闻,覆盖行业动态、技术突破、产业应用与投融资。

* 如需查看全部资讯,请在评论区留言「全部」,我们将提供当期全量资讯合集(含来源链接)。 *

* 我们的使命:为您节约时间。 *


==========================================================

** 【 今日要闻速览 】 **

• [Stripe Sessions 2026:Stripe 正为智能体 AI 经济重构支付体系](https://www.forrester.com/blogs/stripe-sessions-2026-stripe-is-re-architecting-payments-for-an-agentic-ai-economy/)

Stripe 在 Sessions 2026 上发布了 288 款产品。 核心思路是:支付正从面向人类,转向面向机器。 这意味着,AI 智能体可以自己完成支付…


• [Cloudflare与Stripe推出新协议,让AI智能体创建账号、购买域名和进行生产部署 - InfoQ](https://www.infoq.cn/article/TbgvhdcciqULlEEmFBbU)

Cloudflare和Stripe联合推出了一项新协议。 这个协议让AI智能体可以自己创建云账户、购买域名,甚至把应用部署上线。 整个过程不需要人类去复制密码或者输入信用卡信息…


• [谷歌掀桌,一口气甩出16个AI王炸 | 雷峰网](https://www.leiphone.com/category/ai/k2qs0VRU74Ub6CCw.html)

谷歌在2026年的开发者大会上,一口气发布了16款核心产品更新。 这场发布会的核心信号是:AI要从少数人的玩具,变成几十亿人的日常工具。 谷歌的策略很清晰,就是让AI渗透到搜索、办公、手机系统等所有常用产品里…


=================================


AI日报20260522
#11
05/22/2026

过去 24 小时,我们从全球权威来源自动抓取 152 条 AI 资讯,经大语言模型分析与去重,精选 14 条核心要闻,覆盖行业动态、技术突破、产业应用与投融资。

* 如需查看全部资讯,请在评论区留言「全部」,我们将提供当期全量资讯合集(含来源链接)。 *

* 我们的使命:为您节约时间。 *


==========================================================

** 【 今日要闻速览 】 **

• [Anthropic与xAI签署400亿美元算力协议,合作期至2029年 | AI周报](https://aiweekly.co/alerts/anthropic-signs-40b-compute-deal-with-xai-through-2029)

Anthropic 和 xAI 签了一份大合同,总金额超过四百亿美元。 这笔钱用来租用马斯克旗下 xAI 的算力,合作期限到二零二九年五月。 消息来源很特别,是 SpaceX 的上市文件,而不是 Anthropic 自己公布的…


• [AMD的下一个重磅芯片希望在英伟达的CPU尚在摇篮中时就击败它们。](https://gizmodo.com/amds-next-big-chip-hopes-to-beat-nvidias-cpus-while-theyre-in-the-crib-2000761487)

AMD 刚刚发布了一款重磅芯片,目标是在英伟达的笔记本 CPU 正式亮相前,抢先一步占领市场。 这款芯片叫锐龙 AI Max Plus Pro 495,采用全新的 Zen 5 架构,有 16 个核心和 32 个线程,最高速度能达到 5.2 G 赫兹。 AMD 说,这是他们第一款能独立运行 3000 亿参数 AI 模型的 x86 处理器…


• [27B数理 SOTA 与3秒情感克隆,有道全面开源“子曰4”多模态与 TTS 引擎 - InfoQ](https://www.infoq.cn/article/isrd9ej6AjO6NiwAfRbI?utm_source=1&utm_medium=article)

网易有道最近把“子曰”大模型升级到了4.0版本。 这次升级的核心是全面开源,包括多模态模型和语音合成引擎。 先说多模态模型,它只有270亿参数,但在处理带图表的数学和物理题上,达到了行业顶尖水平…



AI日报20260521
#12
05/21/2026

过去 24 小时,我们从全球权威来源自动抓取 167 条 AI 资讯,经大语言模型分析与去重,精选 17 条核心要闻,覆盖行业动态、技术突破、产业应用与投融资。

* 如需查看全部资讯,请在评论区留言「全部」,我们将提供当期全量资讯合集(含来源链接)。 *

* 我们的使命:为您节约时间。 *


==========================================================

** 【 今日要闻速览 】 **

• [英伟达高管亲手将首批Vera CPU系统交付给AI巨头 | PCMag](https://au.pcmag.com/ai/117752/nvidia-exec-hand-delivers-first-vera-cpu-systems-to-ai-heavy-hitters)

英伟达近日将首批Vera CPU系统,亲手交给了OpenAI、Anthropic、SpaceX和甲骨文云。 这是英伟达首款定制CPU,专门为智能体AI时代设计。 智能体AI指的是能主动执行任务、而不是只回答问题的AI模型…


• [AWS推出超级计算机,为Anthropic Claude提供算力支持](https://aibusiness.com/foundation-models/aws-launches-supercomputer-anthropic-claude)

亚马逊旗下云服务AWS,在印第安纳州启动了全球最大的AI数据中心之一,雷尼尔项目。 这个超级计算机综合体占地1200英亩,专门用来训练Anthropic的AI模型Claude。 它使用了近50万块AWS自研的Trainium2芯片,这种芯片专为处理AI训练的海量数据而设计…


• [黑石集团将向使用谷歌TPU的人工智能云公司投资50亿美元](https://aibusiness.com/data-centers/blackstone-invest-5b-ai-cloud-company-using-google-tpus)

黑石集团和谷歌联手了。 他们要成立一家新的人工智能云公司,直接挑战英伟达。 这家新公司会提供云服务、数据中心,还有谷歌的TPU芯片…



AI日报20260520
#13
05/20/2026

过去 24 小时,我们从全球权威来源自动抓取 123 条 AI 资讯,经大语言模型分析与去重,精选 15 条核心要闻,覆盖行业动态、技术突破、产业应用与投融资。

* 如需查看全部资讯,请在评论区留言「全部」,我们将提供当期全量资讯合集(含来源链接)。 *

* 我们的使命:为您节约时间。 *


==========================================================

** 【 今日要闻速览 】 **

• [伯克利神作背刺OpenAI:持续学习才是真神-36氪](http://www.36kr.com/p/3815882289192713)

伯克利大学的研究团队最近发布了一个新框架,叫FST,它可能解决大模型的一个核心缺陷。 简单说,现在的AI模型就像个“会做题但学不会新东西的天才”。 每次新对话,它都从零开始,记不住你之前教过它什么…


• [代码驱动的视觉感知:为什么说「看得懂代码」才是大模型攻克理科题的真正钥匙 |CVPR 2026 | 雷峰网](https://www.leiphone.com/category/ai/5V1IJOdYhKnzkAmF.html)

多模态大模型做理科题,经常闹笑话。 问题可能不在推理能力,而在它根本“看不清”图。 上海交大和千问团队发现,模型在几何题上出错,主要原因是视觉感知太差…


• [国产GPU开始造世界!国内首个全栈具身智能仿真平台来了 – 量子位](https://www.qbitai.com/2026/05/420084.html)

国产GPU厂商摩尔线程,最近发布了一个叫MT Lambda的仿真平台。 这是国内首个全栈国产化的具身智能仿真平台。 简单说,就是让机器人在虚拟世界里训练动作,然后直接搬到现实里用…


==========================================================


AI日报20260519
#14
05/19/2026

过去 24 小时,我们从全球权威来源自动抓取 70 条 AI 资讯,经大语言模型分析与去重,精选 14 条核心要闻,覆盖行业动态、技术突破、产业应用与投融资。

* 如需查看全部资讯,请在评论区留言「全部」,我们将提供当期全量资讯合集(含来源链接)。 *

* 我们的使命:为您节约时间。 *


==========================================================

** 【 今日要闻速览 】 **

• [8B模型做生物实验:实验步骤顺序不乱、剂量无幻觉|ICLR 2026 – 量子位](https://www.qbitai.com/2026/05/419386.html)

上海人工智能实验室和复旦大学等团队,最近发布了一个叫Thoth的模型。 它能帮科学家生成生物实验的操作步骤,而且步骤顺序不乱,剂量也不会出错。 过去的大模型写实验方案,经常出现步骤缺失、顺序混乱或者参数幻觉…


• [信通院&清华提出FedRE:用「纠缠」搞定联邦学习三难困境 | CVPR 26 – 量子位](https://www.qbitai.com/2026/05/419373.html)

联邦学习有个经典难题:模型性能、数据隐私和通信开销,三者很难同时兼顾。 中国信通院和清华大学等机构提出一个新框架,叫 FedRE,用“表征纠缠”来解决这个问题。 简单说,联邦学习就是多个设备各自训练模型,不共享原始数据…


• [一只机器狗,把英伟达的算力王座拱翻了 – 量子位](https://www.qbitai.com/2026/05/418969.html)

蔚蓝科技刚刚发布了新一代消费级四足机器人BabyAlpha A3。 它用一组数据直接挑战了英伟达在算力上的主导地位。 过去机器狗能跑能跳,但感知能力一直停留在“能用”阶段…


==========================================================


AI日报20260518
#15
05/18/2026

过去 24 小时,我们从全球权威来源自动抓取 51 条 AI 资讯,经大语言模型分析与去重,精选 9 条核心要闻,覆盖行业动态、技术突破、产业应用与投融资。

* 如需查看全部资讯,请在评论区留言「全部」,我们将提供当期全量资讯合集(含来源链接)。 *

* 我们的使命:为您节约时间。 *


==========================================================

** 【 今日要闻速览 】 **

• [SFT别急着接RL!你的多模态大模型可能一直在“带伤训练” – 量子位](https://www.qbitai.com/2026/05/418814.html)

多模态大模型的后训练,一直有个默认流程:先做SFT,再做强化学习。 但最新研究发现,SFT不仅没给强化学习铺好路,反而在悄悄挖坑。 来自港科大、南洋理工和清华等机构的团队发现,SFT之后模型性能反而下降了…


• [CVPR 2026 自动驾驶与协作智能梳理:模型正在走向可控真实世界 | 雷峰网](https://www.leiphone.com/category/ai/fMkWxfMZbW2XRxwK.html)

CVPR 2026 的研究显示,AI 模型正在从“理解世界”走向“参与世界”。 过去,视觉模型主要回答“看见了什么”。 但现在,自动驾驶、游戏和机器人领域更关心的是“看见之后如何行动”…


• [关于预训练并行化及失败训练运行的笔记。](https://www.dwarkesh.com/p/notes-on-pretraining-parallelisms)

训练大模型时,失败是常态,而不是意外。 最近有技术讨论指出,预训练运行频繁崩溃,背后有两大元凶:破坏因果性和引入偏差。 先说破坏因果性…


==========================================================


AI日报20260517
#16
05/17/2026

过去 24 小时,我们从全球权威来源自动抓取 128 条 AI 资讯,经大语言模型分析与去重,精选 14 条核心要闻,覆盖行业动态、技术突破、产业应用与投融资。

* 如需查看全部资讯,请在评论区留言「全部」,我们将提供当期全量资讯合集(含来源链接)。 *

* 我们的使命:为您节约时间。 *


==========================================================

** 【 今日要闻速览 】 **

• [百度想明白了:旧供给到达极限了 - InfoQ](https://www.infoq.cn/article/rDTKqBrlGD5R93NFDOI8)

百度在最近的Create大会上释放了一个明确信号:旧有的AI供给模式已经到极限了。 过去企业用AI,Token价格虽然降了99%,但消耗量却涨了30到100倍。 百度创始人李彦宏说,Token只代表成本,不代表收益…


• [初创公司推出针对电子表格数据的“大型表格模型”](https://aibusiness.com/foundation-models/startup-large-tabular-model-spreadsheet-data)

一家旧金山初创公司推出了一款专门处理电子表格数据的AI工具。 它叫Nexus,定位是大型表格模型,能理解行列间的复杂关系。 这家公司叫Fundamental,近日以2.55亿美元融资正式亮相…


• [我们对Luel的投资:多模态AI训练数据市场 - Lightspeed Venture Partners](https://lsvp.com/stories/our-investment-in-luel-the-marketplace-for-multimodal-ai-training-data/)

一家风险投资公司领投了Luel的三千一百二十万美元融资。 Luel是一个为多模态AI训练数据搭建的双边市场。 多模态AI指的是能处理文字、图像、声音等多种信息的模型…


==================================


AI日报20260516
#17
05/16/2026

过去 24 小时,我们从全球权威来源自动抓取 164 条 AI 资讯,经大语言模型分析与去重,精选 15 条核心要闻,覆盖行业动态、技术突破、产业应用与投融资。

* 如需查看全部资讯,请在评论区留言「全部」,我们将提供当期全量资讯合集(含来源链接)。 *

* 我们的使命:为您节约时间。 *


==========================================================

** 【 今日要闻速览 】 **

• [Claude脑子里想的,被翻译成人话了,Anthropic新研究看懵人类-36氪](https://www.36kr.com/p/3809801942457865)

Anthropic 最近发布了一项新研究,他们训练了一套系统,能把 AI 模型 Claude 脑子里的想法直接翻译成人类语言。 这套系统叫自然语言自编码器,简称 NLA。 它的工作原理有点像传话游戏,一个模型负责把激活向量翻译成文字,另一个模型负责还原,通过反复训练让翻译越来越准…


• [被计算机使用的AI代理惊艳到了?研究表明,即使是处理常规任务,它们也是"数字灾难"——Digital Trends](https://www.digitaltrends.com/computing/wowed-by-computer-use-ai-agents-research-says-theyre-digital-disasters-even-for-routine-tasks/)

一项新研究给AI智能体泼了盆冷水。 加州大学河滨分校发现,这些能帮你操作电脑的智能体,在八成情况下会做出不当甚至有害的行为。 研究测试了OpenAI、Anthropic、Meta等公司的十款模型…


• [最强黑客大模型,不再是Mythos-36氪](https://www.36kr.com/p/3810136067038725)

微软用一套多智能体系统,在AI漏洞发现基准测试上拿了第一。 成绩是百分之八十八点四五,超过了Anthropic的最强模型Mythos五个百分点。 奇怪的是,微软自己并没有一个能打的前沿模型…



AI日报20260515
#18
05/15/2026

过去 24 小时,我们从全球权威来源自动抓取 180 条 AI 资讯,经大语言模型分析与去重,精选 15 条核心要闻,覆盖行业动态、技术突破、产业应用与投融资。

* 如需查看全部资讯,请在评论区留言「全部」,我们将提供当期全量资讯合集(含来源链接)。 *

* 我们的使命:为您节约时间。 *


==========================================================

** 【 今日要闻速览 】 **

• [拒掉字节、谷歌橄榄枝,Meta 离职大佬田渊栋官宣自立门户!苏妈老黄追着投 - InfoQ](https://www.infoq.cn/article/NTLqPuNVk0Bs7bBzkfRX)

前 Meta 华人 AI 科学家田渊栋,在离职半年后正式宣布创业。 新公司叫 Recursive Superintelligence,首轮融资 6.5 亿美元,估值超过 46 亿美元。 AMD 和英伟达都参与了跟投…


• [把 RAG 做成主流的公司,现在开始“做空”RAG 了 - InfoQ](https://www.infoq.cn/article/KKa2KiT9BxipQtZTZG79)

Pinecone这家公司,当年亲手把RAG推成了AI领域的主流技术。 现在,它却公开宣布:RAG的时代已经结束了。 RAG,全称是检索增强生成,简单说就是让AI模型先查资料再回答问题…


• [从服务器 OS 到 Agent 沙箱:腾讯云如何打通 AI Infra 的生态底座 - InfoQ](https://www.infoq.cn/article/40UQ0beY3L25lo1rWVzb)

腾讯云最近开源了一个叫 Cube Sandbox 的项目,专门为 AI 智能体提供安全执行环境。 这个项目上线四天,就在 GitHub 上获得了超过四千颗星。 简单来说,AI 智能体在执行任务时,会动态生成代码并调用系统命令…


==========================================================


AI日报20260514
#19
05/14/2026

过去 24 小时,我们从全球权威来源自动抓取 182 条 AI 资讯,经大语言模型分析与去重,精选 14 条核心要闻,覆盖行业动态、技术突破、产业应用与投融资。

* 如需查看全部资讯,请在评论区留言「全部」,我们将提供当期全量资讯合集(含来源链接)。 *

* 我们的使命:为您节约时间。 *


==========================================================

** 【 今日要闻速览 】 **

• [谷歌在Next 26大会上宣布推出GKE Agent Sandbox和Hypercluster,并将Kubernetes定位为AI代理 - InfoQ](https://www.infoq.cn/article/BNvwzwb29PU4AORhPqbZ)

谷歌在最近的Cloud Next大会上宣布了多项重要更新。 其中,GKE Agent Sandbox和GKE Hypercluster是两个最受关注的新功能。 先说Agent Sandbox,它专门用来安全执行AI代理的代码…


• [Cortex 智能代理:赋能 Snowflake Intelligence 打造企业级 AI 代理核心平台 |技术趋势 - InfoQ](https://www.infoq.cn/article/och7xCsthoziccjC2cmY)

Snowflake 推出了一款名为 Cortex 智能代理的核心平台。 它专门用来帮助企业构建和治理自己的 AI 代理。 简单说,AI 代理就像一个能帮你干活的数字员工…


• [在Amazon SageMaker AI上微调大语言模型时应对欧盟《人工智能法案》要求 | 人工智能](https://aws.amazon.com/blogs/machine-learning/navigating-eu-ai-act-requirements-for-llm-fine-tuning-on-amazon-sagemaker-ai/)

欧盟《人工智能法案》在2025年8月生效,对微调大语言模型的公司提出了新要求。 关键看微调消耗的计算量,如果超过原始训练计算量的三分之一,就可能被重新归类为模型提供者,承担更多法律责任。 亚马逊云服务推出了一个开源工具,叫Fine-Tuning FLOPs Meter,可以自动跟踪计算量…



AI日报20260513
#20
05/13/2026

过去 24 小时,我们从全球权威来源自动抓取 161 条 AI 资讯,经大语言模型分析与去重,精选 15 条核心要闻,覆盖行业动态、技术突破、产业应用与投融资。

* 如需查看全部资讯,请在评论区留言「全部」,我们将提供当期全量资讯合集(含来源链接)。 *

* 我们的使命:为您节约时间。 *


==========================================================

** 【 今日要闻速览 】 **

• [Mistral为Le Chat新增远程智能体与Work模式 - InfoQ](https://www.infoq.cn/article/14UTzo6myptzQ1GqBdOG)

法国AI公司Mistral发布了新模型,叫Mistral Medium 3.5。 这个模型有1280亿参数,能同时处理指令、推理和编码。 它支持最长256k Token的上下文,相当于一次能记住很长的对话…


• [OpenAI 前 CTO,拿出了一个「最人性」的 AI | 极客公园](https://www.geekpark.net/news/364044)

OpenAI 前首席技术官米拉·穆拉蒂,在沉寂18个月后,带着新公司Thinking Machines Lab,发布了一款全新的AI交互模型。 这个模型的核心是让AI不再像发微信一样一条一条回复,而是像面对面聊天一样,随时听、随时看、随时插嘴。 比如用户做俯卧撑时,AI会在一旁数数;写代码出错时,AI会主动提醒…


• [豪掷270亿元,OpenAI成立新公司,加速AI落地-36氪](http://www.36kr.com/p/3806181043248897)

OpenAI成立了一家新公司,专门帮企业部署人工智能。 这家公司叫OpenAI部署公司,初始投资超过40亿美元,折合人民币约272亿元。 新公司由OpenAI控股,背后有19家投资机构和咨询公司支持…


==========================================================


AI日报20260512
#21
05/12/2026

过去 24 小时,我们从全球权威来源自动抓取 87 条 AI 资讯,经大语言模型分析与去重,精选 8 条核心要闻,覆盖行业动态、技术突破、产业应用与投融资。

* 如需查看全部资讯,请在评论区留言「全部」,我们将提供当期全量资讯合集(含来源链接)。 *

* 我们的使命:为您节约时间。 *


==========================================================

** 【 今日要闻速览 】 **

• [从"卖图纸"到"盖房子",ARM有着什么样的思考?-36氪](https://www.36kr.com/p/3804194472288009)

一家卖了几十年芯片设计图纸的公司,突然决定自己下场造芯片。 这家公司叫ARM,全球超过99%的智能手机芯片都用了它的架构。 过去ARM只卖设计授权,不碰制造,毛利率高达95%…


• [英伟达32亿锁产能,这个赛道风口来了?-36氪](https://www.36kr.com/p/3803078378856201)

英伟达最近花32亿美元,锁定了光纤上游的专属产能。 这笔投资不是普通采购,而是英伟达第一次用数十亿级的长协订单,把光纤变成了AI基建里的战略性资源。 光纤是AI数据中心传输数据的核心通道,GPU之间同步参数全靠它…


• [38万应用暴露、2000+应用泄密,AI编程把“内网”变公网-36氪](https://www.36kr.com/p/3801593671081735)

最近一项研究显示,AI编程工具正在把企业内部数据直接暴露到公网上。 以色列安全公司RedAccess发现,约38万个用AI工具创建的应用可以公开访问。 其中近2000个应用泄露了敏感信息,包括医疗记录、财务数据和公司战略文件…


==========================================================


AI日报20260511
#22
05/11/2026

过去 24 小时,我们从全球权威来源自动抓取 39 条 AI 资讯,经大语言模型分析与去重,精选 7 条核心要闻,覆盖行业动态、技术突破、产业应用与投融资。

* 如需查看全部资讯,请在评论区留言「全部」,我们将提供当期全量资讯合集(含来源链接)。 *

* 我们的使命:为您节约时间。 *


==========================================================

** 【 今日要闻速览 】 **

• [《OncoAgent:面向隐私保护肿瘤临床决策支持的双层多智能体框架》](https://huggingface.co/blog/lablab-ai-amd-developer-hackathon/oncoagent-official-paper)

一个专门为肿瘤医生打造的AI助手来了,它叫OncoAgent。 这个系统最大的特点,是能保护患者隐私,同时给出基于权威指南的治疗建议。 它把临床推理拆成了八个专门的步骤,每个步骤都像流水线上的独立环节,清晰可查…


• [从单点到协同:考拉悠然智能体工厂,让政企 AI 真正落地见效 | 极客公园](https://www.geekpark.net/news/363881)

考拉悠然推出了一款叫智能体工厂的产品。 它要解决的是政企单位用AI时的一个普遍难题。 很多企业和政府部门部署了几十个甚至上百个AI智能体…


• [Legare Kerrison 与 Cedric Clyburn 谈 LLM 性能与评估 - InfoQ](https://www.infoq.cn/article/yOpJquR36lZKRU5TpjAP)

红帽团队在 Arc of AI 2026 大会上分享了评估大语言模型性能的实用方法。 他们指出,2026 年可能成为“LLM 评估之年”。 这意味着企业需要更精准地衡量模型表现,而不是只看排行榜…


==========================================================


AI日报20260510
#23
05/10/2026

过去 24 小时,我们从全球权威来源自动抓取 101 条 AI 资讯,经大语言模型分析与去重,精选 11 条核心要闻,覆盖行业动态、技术突破、产业应用与投融资。

* 如需查看全部资讯,请在评论区留言「全部」,我们将提供当期全量资讯合集(含来源链接)。 *

* 我们的使命:为您节约时间。 *


==========================================================

** 【 今日要闻速览 】 **

• [不更新参数就能强化学习!OpenAI翁家翌提出新范式:决策只需AI手搓一个.py 文件 – 量子位](https://www.qbitai.com/2026/05/414827.html)

OpenAI 的研究员翁家翌提出了一种全新的强化学习方法,叫做启发式学习。 它不依赖传统的神经网络训练,而是让 AI 自己写代码来学习决策。 在经典游戏 Breakout 上,这个方法直接拿到了满分 864 分…


• [EMO:面向涌现模块化的专家混合预训练](https://huggingface.co/blog/allenai/emo)

艾伦人工智能研究院发布了一款新模型,叫EMO。 它最大的特点是,模型内部的模块不是人为划分的,而是从数据里自己长出来的。 传统的大型语言模型,就像一个巨大的工具箱,每次用都得把整个箱子搬出来…


• [百度发布文心 5.1:搜索能力登顶国内,预训练成本仅为业界 6% – 量子位](https://www.qbitai.com/2026/05/414496.html)

百度在五月九号发布了新一代基础大模型,文心大模型5.1。 它的搜索能力登上了国内第一,全球第四。 这个模型用了一个叫多维弹性预训练的技术…


==========================================================


AI日报20260509
#24
05/09/2026

过去 24 小时,我们从全球权威来源自动抓取 173 条 AI 资讯,经大语言模型分析与去重,精选 14 条核心要闻,覆盖行业动态、技术突破、产业应用与投融资。

* 如需查看全部资讯,请在评论区留言「全部」,我们将提供当期全量资讯合集(含来源链接)。 *

* 我们的使命:为您节约时间。 *


==========================================================

** 【 今日要闻速览 】 **

• [Anthropic最新论文撬开大模型黑箱:隐藏动机发现率提升4倍以上 - InfoQ](https://www.infoq.cn/article/gAkVCqphr0A1r2PLSWDz)

Anthropic 发布了一项新研究,用一种叫自然语言自编码器的技术,撬开了大模型的黑箱。 这项技术能把模型内部那些人类看不懂的高维数据,翻译成我们能读懂的句子。 过去,我们只能看模型的输出和推理过程,但模型到底在想什么,很难确认…


• [Redis之父下场,给DeepSeek V4单独造了一台推理引擎 – 量子位](https://www.qbitai.com/2026/05/414316.html)

Redis 的创始人,程序员圈里叫他 antirez,最近给 DeepSeek V4 单独造了一个推理引擎。 这个引擎叫 ds4.c,只干一件事:让 DeepSeek V4 在苹果电脑上跑得飞快。 antirez 是 Redis 的创造者,主导这个项目十一年…


• [执行交易的代理:介绍基于Coinbase和Stripe构建的Amazon Bedrock AgentCore支付系统 | 人工智能](https://aws.amazon.com/blogs/machine-learning/agents-that-transact-introducing-amazon-bedrock-agentcore-payments-built-with-coinbase-and-stripe/)

亚马逊云服务推出了一项新功能,让AI智能体可以自己付钱买东西。 简单说,智能体不再只是回答问题,还能调用付费的API、访问数据或使用其他服务。 过去开发者需要手动建立每个支付关系,耗时又容易出错…



AI日报20260508
#25
05/08/2026

过去 24 小时,我们从全球权威来源自动抓取 151 条 AI 资讯,经大语言模型分析与去重,精选 14 条核心要闻,覆盖行业动态、技术突破、产业应用与投融资。

* 如需查看全部资讯,请在评论区留言「全部」,我们将提供当期全量资讯合集(含来源链接)。 *

* 我们的使命:为您节约时间。 *


==========================================================

** 【 今日要闻速览 】 **

• [开放权重正在悄然收紧——这确实是个问题——马丁·奥尔德森](https://martinalderson.com/posts/open-weights-are-quietly-closing-up/?utm_source=rss&utm_medium=rss&utm_campaign=feed)

开放权重模型正在悄悄收紧,这可能会影响你未来用AI的成本和选择。 过去几年,像Meta的Llama、中国的DeepSeek和阿里巴巴的Qwen,都发布过开放权重模型。 这类模型允许任何人用自己的电脑或服务器运行,不需要通过大公司的API…


• [解散xAI ,马斯克和Anthropic都赢麻了-36氪](http://www.36kr.com/p/3798774777983496)

马斯克宣布解散xAI,所有业务并入SpaceX,新公司叫SpaceXAI。 同一天,SpaceX还把Colossus 1数据中心的全部算力租给了竞争对手Anthropic。 xAI成立不到三年就画上句号,背后是赤裸裸的商业逻辑…


• [英伟达AMD英特尔博通联手,堵上GPU算力浪费的漏洞-36氪](http://www.36kr.com/p/3798912873159942)

OpenAI 联合英伟达、AMD、英特尔和博通,发布了一个全新的网络协议,叫 MRC。 这个协议能解决 AI 训练时,GPU 算力被白白浪费的问题。 简单说,训练大模型需要成千上万块 GPU 协同工作,网络一旦拥堵或故障,很多 GPU 就会闲置…


==============


AI日报20260507
#26
05/07/2026

过去 24 小时,我们从全球权威来源自动抓取 140 条 AI 资讯,经大语言模型分析与去重,精选 14 条核心要闻,覆盖行业动态、技术突破、产业应用与投融资。

* 如需查看全部资讯,请在评论区留言「全部」,我们将提供当期全量资讯合集(含来源链接)。 *

* 我们的使命:为您节约时间。 *


==========================================================

** 【 今日要闻速览 】 **

• [SAP斥资11.6亿美元押注成立仅18个月的德国AI实验室,并对NemoClaw表示认可 | TechCrunch](https://techcrunch.com/2026/05/05/sap-bets-1-16b-on-18-month-old-german-ai-lab-and-says-yes-to-nemoclaw/)

企业软件巨头SAP,花11.6亿美元收购了一家成立仅18个月的德国AI初创公司。 这家公司叫Prior Labs,专门做表格和数据库的AI模型,正好补上SAP的短板。 SAP的软件,比如会计和人事系统,都依赖数据库…


• [CodeGuardian:一种用于AI代码质量分析和安全扫描的模型上下文协议服务器 - InfoQ](https://www.infoq.cn/article/VkpOOYrXHY8Q2Ax6JE8N)

AI代码助手能写代码,但写出来的代码安不安全,一直是个问题。 现在,一个叫CodeGuardian的新工具,试图解决这个痛点。 它本质上是一个“模型上下文协议”服务器,可以嵌入到GitHub Copilot这类AI助手里…


• [在Amazon Bedrock Agent核心浏览器中引入操作系统级操作 | 人工智能](https://aws.amazon.com/blogs/machine-learning/introducing-os-level-actions-in-amazon-bedrock-agentcore-browser/)

亚马逊云服务为AI代理推出了一项新能力。 现在,AI代理不仅能操作网页,还能控制整个电脑桌面。 过去,AI代理在浏览器里自动化操作时,会遇到一个硬边界…



AI日报20260506
#27
05/06/2026

过去 24 小时,我们从全球权威来源自动抓取 93 条 AI 资讯,经大语言模型分析与去重,精选 13 条核心要闻,覆盖行业动态、技术突破、产业应用与投融资。

* 如需查看全部资讯,请在评论区留言「全部」,我们将提供当期全量资讯合集(含来源链接)。 *

* 我们的使命:为您节约时间。 *


==========================================================

** 【 今日要闻速览 】 **

• [基于智能代理的工作流加速Amazon SageMaker AI中的模型定制 | 人工智能](https://aws.amazon.com/blogs/machine-learning/agent-guided-workflows-to-accelerate-model-customization-in-amazon-sagemaker-ai/)

亚马逊云服务最近推出了一项新功能,让定制人工智能模型变得更简单。 过去,企业想用自己数据微调模型,需要几个月时间和专业团队。 现在,在Amazon SageMaker AI平台上,开发者只需用自然语言描述需求…


• [OpenAI 如何大规模提供低延迟语音人工智能 | OpenAI](https://openai.com/index/delivering-low-latency-voice-ai-at-scale)

OpenAI 最近公布了一项技术升级,专门解决语音 AI 对话中的卡顿和延迟问题。 简单来说,就是让 AI 说话时不再有尴尬的停顿,听起来更像真人聊天。 为了实现这一点,OpenAI 重新设计了网络传输架构…


• [容量感知推理:SageMaker AI端点的自动实例回退机制 | 人工智能](https://aws.amazon.com/blogs/machine-learning/capacity-aware-inference-automatic-instance-fallback-for-sagemaker-ai-endpoints/)

亚马逊云服务为SageMaker AI推理端点推出了一项新功能。 它叫实例池,能自动帮你解决GPU算力不足的问题。 过去,你部署一个AI模型时,只能指定一种实例类型…



AI日报20260505
#28
05/05/2026

过去 24 小时,我们从全球权威来源自动抓取 60 条 AI 资讯,经大语言模型分析与去重,精选 7 条核心要闻,覆盖行业动态、技术突破、产业应用与投融资。

* 如需查看全部资讯,请在评论区留言「全部」,我们将提供当期全量资讯合集(含来源链接)。 *

* 我们的使命:为您节约时间。 *


==========================================================

** 【 今日要闻速览 】 **

• [Anthropic搞了个全是AI的闲鱼群,大模型在里面互割起了韭菜-36氪](https://www.36kr.com/p/3794465919704322)

Anthropic 最近做了一个有趣的实验,他们搞了一个全是 AI 的二手交易群。 在这个群里,AI 代理代替人类完成买卖和砍价,整个过程没有人类干预。 实验发现,更聪明的大模型在谈判中,能从较弱模型那里多赚约百分之十到十五的利润…


• [万亿级数字员工市场,大厂下场之后,创业者还能吃哪一口? | 极客公园](https://www.geekpark.net/news/363700)

大厂正在加速布局数字员工市场,但创业者真正的机会,可能不在模型本身,而在帮企业划清一条边界。 这条边界,就是AI Agent能碰什么、不能碰什么。 过去,软件的行为是写死的,权限边界很清楚…


• [“DeepSeek版Claude Code”,Github 2.3k星 – 量子位](https://www.qbitai.com/2026/05/412914.html)

DeepSeek也有自己专属的编程助手了。 这个工具叫DeepSeek-TUI,在GitHub上已经获得超过2300颗星,还登上了热榜。 它就像Claude Code的DeepSeek版本,专门在终端里运行,用Rust语言编写…


==========================================================


AI日报20260504
#29
05/04/2026

过去 24 小时,我们从全球权威来源自动抓取 59 条 AI 资讯,经大语言模型分析与去重,精选 9 条核心要闻,覆盖行业动态、技术突破、产业应用与投融资。

* 如需查看全部资讯,请在评论区留言「全部」,我们将提供当期全量资讯合集(含来源链接)。 *

* 我们的使命:为您节约时间。 *


==========================================================

** 【 今日要闻速览 】 **

• [在硅谷,中美具身公司聊了聊了4个问题的解法-36氪](https://www.36kr.com/p/3792155815304450)

最近,一场关于具身智能的讨论在硅谷展开,中美多家公司聚在一起,聊了四个核心问题。 具身智能,就是让机器人像人一样感知和行动。 现在行业最头疼的是数据不够用…


• [魔法原子进军硅谷背后:世界模型野望与生态卡位 | 极客公园](https://www.geekpark.net/news/363699)

一家中国机器人公司,把发布会开到了硅谷。 这就是魔法原子,他们刚刚发布了新一代人形机器人和灵巧手。 更重要的是,他们首次公开了自己的世界模型,叫Magic-Mix…


• [中国法院裁定:以AI替代员工进行裁员属违法行为](https://gizmodo.com/its-illegal-in-china-to-lay-someone-off-to-replace-them-with-ai-court-finds-2000753791)

中国法院最近作出了一项重要裁定。 以AI自动化替代员工为由解雇员工,属于违法行为。 这起案件发生在杭州…


==========================================================


AI日报20260503
#30
05/03/2026

过去 24 小时,我们从全球权威来源自动抓取 72 条 AI 资讯,经大语言模型分析与去重,精选 11 条核心要闻,覆盖行业动态、技术突破、产业应用与投融资。

* 如需查看全部资讯,请在评论区留言「全部」,我们将提供当期全量资讯合集(含来源链接)。 *

* 我们的使命:为您节约时间。 *


==========================================================

** 【 今日要闻速览 】 **

• [华为携手中科大发布灵境造物,openJiuwen首发Coordination Engineering全栈支撑 – 量子位](https://www.qbitai.com/2026/05/412696.html)

中国科学技术大学在四月底发布了一个叫“灵境造物”的智能科研云平台。 这个平台面向全球开放,它让AI不再只是辅助工具,而是能自主规划、分工协作的“AI科学家”。 这个平台基于全栈国产化软硬件打造,核心是华为支持的openJiuwen社区…


• [五角大楼与英伟达、微软和AWS签署协议,在机密网络上部署人工智能 | TechCrunch](https://techcrunch.com/2026/05/01/pentagon-inks-deals-with-nvidia-microsoft-and-aws-to-deploy-ai-on-classified-networks/)

美国国防部上周五宣布,与英伟达、微软和亚马逊云服务签署协议。 这些公司的人工智能技术,将被部署在机密网络中,用于合法作战用途。 这是五角大楼加速推进人工智能供应商多元化的最新一步…


• [AWS Transform 现可在数日内自动完成BI迁移至Amazon Quick | 人工智能](https://aws.amazon.com/blogs/machine-learning/aws-transform-now-automates-bi-migration-to-amazon-quick-in-days/)

亚马逊云服务推出了一项新功能,叫AWS Transform。 它能帮企业把商业智能工具,也就是BI工具,自动迁移到Amazon Quick上。 以前这个过程要花好几个月,现在只需要几天…



AI日报20260501
#31
05/01/2026

过去 24 小时,我们从全球权威来源自动抓取 230 条 AI 资讯,经大语言模型分析与去重,精选 14 条核心要闻,覆盖行业动态、技术突破、产业应用与投融资。

* 如需查看全部资讯,请在评论区留言「全部」,我们将提供当期全量资讯合集(含来源链接)。 *

* 我们的使命:为您节约时间。 *


==========================================================

** 【 今日要闻速览 】 **

• [AI评估正成为新的计算瓶颈。](https://huggingface.co/blog/evaleval/eval-costs-bottleneck)

评估AI模型这件事,正在变成新的算力瓶颈。 过去训练模型很贵,评估很便宜。 现在情况反过来了…


• [并行网络系统在上一轮大额融资五个月后估值达到20亿美元 | TechCrunch](https://techcrunch.com/2026/04/29/parallel-web-systems-hits-2b-valuation-five-months-after-its-last-big-raise/)

前推特CEO帕拉格·阿格拉瓦尔创立的AI代理公司Parallel Web Systems,在五个月内估值从7.4亿美元涨到20亿美元。 这家公司刚拿到红杉资本领投的1亿美元B轮融资,总融资额达到2.3亿美元。 Parallel做的是给AI代理用的网络搜索和研究工具,客户包括Notion、Opendoor这些公司,还有超过10万名开发者在使用…


• [AI模型和Agent创新,倒逼AI Infra产生了哪些创业机会?-36氪](https://www.36kr.com/p/3787679275441413)

AI网络通信领域正在变热。 半年内,多家公司拿到单笔超亿美元融资。 原因很简单:模型越来越大,算力越来越不够用…


==========================================================


AI日报20260430
#32
04/30/2026

过去 24 小时,我们从全球权威来源自动抓取 177 条 AI 资讯,经大语言模型分析与去重,精选 14 条核心要闻,覆盖行业动态、技术突破、产业应用与投融资。

* 如需查看全部资讯,请在评论区留言「全部」,我们将提供当期全量资讯合集(含来源链接)。 *

* 我们的使命:为您节约时间。 *


==========================================================

** 【 今日要闻速览 】 **

• [凌晨,OpenAI 与亚马逊云科技史上最大联合发布来了-36氪](https://www.36kr.com/p/3787281211743492)

亚马逊云科技和OpenAI联手了。 OpenAI的模型将直接进入亚马逊云科技的Bedrock平台。 这意味着企业能更方便地使用顶级AI…


• [NVIDIA Nemotron 3 Nano Omni 发布:面向文档、音频和视频代理的长上下文多模态智能](https://huggingface.co/blog/nvidia/nemotron-3-nano-omni-multimodal-intelligence)

英伟达发布了一款新模型,叫 Nemotron 3 Nano Omni。 它能同时处理文字、图片、音频和视频,就像一个全能助手。 这款模型特别擅长分析长篇文档,比如合同或技术报告…


• [银河通用LDA定义全域数据利用范式,跨本体世界动作大模型开启具身GPT-2时刻 – 量子位](https://www.qbitai.com/2026/04/410653.html)

银河通用发布了一个新的机器人模型,叫LDA-1B。 它最大的特点是,训练数据不再挑食。 过去,机器人学习需要高质量、带标注的专家数据…


==========================================================


AI日报20260428
#33
04/28/2026

过去 24 小时,我们从全球权威来源自动抓取 98 条 AI 资讯,经大语言模型分析与去重,精选 9 条核心要闻,覆盖行业动态、技术突破、产业应用与投融资。

* 如需查看全部资讯,请在评论区留言「全部」,我们将提供当期全量资讯合集(含来源链接)。 *

* 我们的使命:为您节约时间。 *


==========================================================

** 【 今日要闻速览 】 **

• [超越Claude Mythos与GPT-5.5,斯坦福Agent验证框架实现SOTA,Transformer作者转发——36氪](http://www.36kr.com/p/3784656027442185)

斯坦福大学和伯克利的研究团队,联合英伟达,推出了一款新的AI验证框架。 这个框架叫LLM-as-a-Verifier,它能让AI智能体在复杂任务中表现更出色。 Transformer论文的作者和GAN的作者,都转发了这项研究…


• [世界模型能实时玩了,蚂蚁灵波开源LingBot-World-Fast - InfoQ](https://www.infoq.cn/article/rkoWDHOOb2VFyIGKwuym)

蚂蚁集团旗下的灵光App,最近上线了一个新功能。 用户上传一张图片,就能在手机上生成一个60秒的3D世界。 你可以用第一人称视角,像玩游戏一样在里面自由漫游…


• [DeepSeek V4 Pro(推理模式,最大努力)与 Mercury 2:模型对比](https://artificialanalysis.ai/models/comparisons/deepseek-v4-pro-vs-mercury-2)

独立评测机构人工分析,最近发布了一份模型对比报告。 这次比较的主角,是DeepSeek V4 Pro的推理模式,和一款叫Mercury 2的模型。 先说智能水平…


==========================================================


AI日报20260427
#34
04/27/2026

过去 24 小时,我们从全球权威来源自动抓取 42 条 AI 资讯,经大语言模型分析与去重,精选 6 条核心要闻,覆盖行业动态、技术突破、产业应用与投融资。

* 如需查看全部资讯,请在评论区留言「全部」,我们将提供当期全量资讯合集(含来源链接)。 *

* 我们的使命:为您节约时间。 *


==========================================================

** 【 今日要闻速览 】 **

• [全球首个医疗视频理解大模型开源!6k+组精标测试集与英雄榜同步上线,开发者速来! – 量子位](https://www.qbitai.com/2026/04/407486.html)

全球首个能看懂手术视频的AI大模型正式开源了。 它叫uAI Nexus MedVLM,中文名是元智医疗视频理解大模型。 这个模型由联影智能开发,论文已经被计算机视觉顶会CVPR 2026收录…


• [Cohere 与 Aleph Alpha 合并的原因 | TechCrunch](https://techcrunch.com/2026/04/25/why-cohere-is-merging-with-aleph-alpha/)

加拿大AI公司Cohere正在收购德国同行Aleph Alpha。 这笔交易得到了两国政府支持,目标是打造一个主权AI选项。 所谓主权AI,就是让企业和政府能完全掌控自己的数据,而不是交给美国科技巨头…


• [Anthropic推出面向Claude Code的基于智能体的代码审查功能 - InfoQ](https://www.infoq.cn/article/QyeZg05iakideMTGCQKi)

Anthropic 为它的编程助手 Claude Code 推出了一项新功能。 它能自动审查程序员提交的代码,就像请了好几个 AI 同事一起帮忙找错。 这个系统会在代码提交后自动启动…


==========================================================


AI日报20260426
#35
04/26/2026

过去 24 小时,我们从全球权威来源自动抓取 101 条 AI 资讯,经大语言模型分析与去重,精选 12 条核心要闻,覆盖行业动态、技术突破、产业应用与投融资。

* 如需查看全部资讯,请在评论区留言「全部」,我们将提供当期全量资讯合集(含来源链接)。 *

* 我们的使命:为您节约时间。 *


==========================================================

** 【 今日要闻速览 】 **

• [GPT-5.5 (xhigh) 与 Qwen3 Max Thinking:模型对比](https://artificialanalysis.ai/models/comparisons/gpt-5-5-vs-qwen3-max-thinking)

OpenAI 的 GPT-5.5 和阿里巴巴的 Qwen3 Max Thinking,谁更强? 一份来自人工分析的独立评测给出了答案。 GPT-5.5 在智能指数上排名第二,领先于 Qwen3 Max Thinking…


• [疯狂涨价!AI风口下的“黄金材料”-36氪](http://www.36kr.com/p/3782062374051074)

一种叫磷化铟的半导体材料,一年多时间价格涨了近两倍。 它是AI数据中心里高速光模块的核心材料,目前没有量产替代品。 全球九成以上的产能被三家日美企业控制,国内高端产品国产化率不足百分之五…


• [深度思维衍生公司设计的AI药物即将进入人体试验阶段 | 《连线》杂志](https://www.wired.com/story/wired-health-2026-how-ai-is-powering-drug-discovery-max-jaderberg/)

谷歌深度思维旗下的衍生公司,设计了一款AI药物,即将进入人体试验阶段。 这家公司叫Isomorphic Labs,它的总裁在伦敦的《连线》健康大会上透露,公司已经建立起一条广泛的新药研发管线。 这款药物的基础,是深度思维的蛋白质结构预测工具AlphaFold…


=========


AI日报20260425
#36
04/25/2026

过去 24 小时,我们从全球权威来源自动抓取 169 条 AI 资讯,经大语言模型分析与去重,精选 13 条核心要闻,覆盖行业动态、技术突破、产业应用与投融资。

* 如需查看全部资讯,请在评论区留言「全部」,我们将提供当期全量资讯合集(含来源链接)。 *

* 我们的使命:为您节约时间。 *


==========================================================

** 【 今日要闻速览 】 **

• [何恺明、谢赛宁署名,Google DeepMind推出Vision Banana:图像生成器即通才视觉学习者-36氪](https://www.36kr.com/p/3780628766825728)

谷歌DeepMind团队推出了一款名为Vision Banana的视觉模型。 它把图像生成器变成了一个通用的视觉理解工具。 这项工作的核心思路是“生成即理解”…


• [DeepSeek-V4发布,华为云首发适配 – 量子位](https://www.qbitai.com/2026/04/406791.html)

4月24号,DeepSeek发布了第四代模型,叫DeepSeek-V4,并且直接开源了。 华为云是第一个完成适配的云服务商。 这个模型最大的亮点是支持百万Token的超长上下文,相当于一次能处理一整本厚书的信息量…


• [OpenAI的GPT-5.5是新一代领先的人工智能模型](https://artificialanalysis.ai/articles/openai-gpt5-5-is-the-new-leading-AI-model)

OpenAI 的 GPT-5.5 成为新一代领先的 AI 模型。 它在人工分析智能指数上领先三分,打破了与 Anthropic 和 Google 的三方平局。 GPT-5.5 在五项核心评估中排名第一…


==========================================================


AI日报20260424
#37
04/23/2026

过去 24 小时,我们从全球权威来源自动抓取 139 条 AI 资讯,经大语言模型分析与去重,精选 13 条核心要闻,覆盖行业动态、技术突破、产业应用与投融资。

* 如需查看全部资讯,请在评论区留言「全部」,我们将提供当期全量资讯合集(含来源链接)。 *

* 我们的使命:为您节约时间。 *


==========================================================

** 【 今日要闻速览 】 **

• [一年烧掉 1850 亿美元、Google 要做智能体时代的「企业 Windows」-36氪](http://www.36kr.com/p/3779085648204802)

Google Cloud 在最近的 Next 大会上,发布了一个叫 Gemini Enterprise 的新平台。 它的目标,是成为智能体时代的“企业操作系统”。 简单说,就是帮企业管理成千上万个 AI 智能体,从创建、授权到监控,全包了…


• [百灵Ling-2.6-flash 正式发布:高 Token 效率,以 1/10 消耗实现 SOTA 级 Agent 能力 - InfoQ](https://www.infoq.cn/article/haZgR6XNQhh7r448wxPP)

蚂蚁百灵在4月22号发布了一款新模型,叫Ling-2.6-flash。 它最大的特点是特别省,能用更少的计算资源达到顶尖水平。 这款模型总参数有1040亿,但每次只激活其中74亿个参数…


• [几分钟内即可获得您的第一个工作代理:宣布Amazon Bedrock AgentCore的新功能 | 人工智能](https://aws.amazon.com/blogs/machine-learning/get-to-your-first-working-agent-in-minutes-announcing-new-features-in-amazon-bedrock-agentcore/)

亚马逊云服务发布了一项新功能,叫AgentCore。 它能让开发者几分钟内就搭建出可用的AI智能体,而不是花好几天处理基础设施。 过去,团队要先配置框架、存储和身份验证,才能测试智能体本身…



AI日报20260423
#38
04/23/2026

过去 24 小时,我们从全球权威来源自动抓取 160 条 AI 资讯,经大语言模型分析与去重,精选 17 条核心要闻,覆盖行业动态、技术突破、产业应用与投融资。

* 如需查看全部资讯,请在评论区留言「全部」,我们将提供当期全量资讯合集(含来源链接)。 *

* 我们的使命:为您节约时间。 *


==========================================================

** 【 今日要闻速览 】 **

• [谷歌 Aletheia 推动全自主代理式数学研究迈向新高度 - InfoQ](https://www.infoq.cn/article/XqhLJyRQ7ZMIPXqVlwsh)

谷歌发布了一个能自主研究数学的AI系统。 这标志着人工智能在需要深度推理的领域取得了新突破。 这个系统名叫阿勒忒亚,基于谷歌的Gemini模型…


• [国产多模态Agent拿下医学分割SOTA!不用改模型、不加token – 量子位](https://www.qbitai.com/2026/04/404604.html)

浙江大学的研究团队近日发布了一个新的医学图像分析框架。 这个框架在生物医学图像分割任务上取得了目前最好的成绩。 医学图像分割,简单说就是让AI在CT或核磁共振图像上,把病灶区域精准地圈出来…


• [为 AI 智能体设计记忆机制:揭秘 LinkedIn 的认知记忆智能体 - InfoQ](https://www.infoq.cn/article/SCh9qpVmgQ1ObT3eVR17)

领英最近为它的AI智能体装上了记忆系统。 这解决了大语言模型的一个常见问题,就是记不住事儿。 这个系统叫做认知记忆智能体,简称CMA…


==========================================================


AI日报20260422
#39
04/22/2026

过去 24 小时,我们从全球权威来源自动抓取 119 条 AI 资讯,经大语言模型分析与去重,精选 16 条核心要闻,覆盖行业动态、技术突破、产业应用与投融资。

* 如需查看全部资讯,请在评论区留言「全部」,我们将提供当期全量资讯合集(含来源链接)。 *

* 我们的使命:为您节约时间。 *


==========================================================

** 【 今日要闻速览 】 **

• [AI Infra产业链卡在哪里了?-36氪](http://www.36kr.com/p/3776378013090567)

你可能已经注意到,各种人工智能应用正变得越来越强大。 但支撑这些应用的底层基础设施,却面临着一系列瓶颈。 近日有分析指出,人工智能基础设施产业链正遭遇系统性的制约…


• [比OpenClaw还狠,奥特曼押注“心灵感应”,Codex直接读取你的屏幕-36氪](http://www.36kr.com/p/3776484666999552)

OpenAI发布了一项名为Chronicle的新功能。 它能让AI助手记住你电脑屏幕上发生的一切。 这项功能目前以研究预览版的形式上线…


• [谷歌也急了-36氪](http://www.36kr.com/p/3776106127962885)

近日,谷歌内部组建了一支特别团队。 他们的目标是提升自家人工智能的编程能力。 据媒体报道,谷歌联合创始人谢尔盖·布林在一份内部备忘录中要求员工必须果断转向…


==========================================================

** 【 行业


AI日报20260421
#40
04/21/2026

过去 24 小时,我们从全球权威来源自动抓取 99 条 AI 资讯,经大语言模型分析与去重,精选 14 条核心要闻,覆盖行业动态、技术突破、产业应用与投融资。

* 如需查看全部资讯,请在评论区留言「全部」,我们将提供当期全量资讯合集(含来源链接)。 *

* 我们的使命:为您节约时间。 *


==========================================================

** 【 今日要闻速览 】 **

• [20亿美金苏度科技具身首秀即大招!0真机数据,zero-shot,跑出98%首次抓取成功率 – 量子位](https://www.qbitai.com/2026/04/403543.html)

一家名为苏度科技的公司近日发布了其首个具身智能模型。 这个模型能让机器人直接抓取从未见过的物体。 具身智能简单来说就是让机器拥有身体,能在物理世界里执行任务…


• [Mythos架构被22岁小伙“逆推”开源了!MoE和注意力借鉴DeepSeek – 量子位](https://www.qbitai.com/2026/04/403708.html)

近日,一个名为OpenMythos的项目在开源社区引发了关注。 它试图复现人工智能公司Anthropic尚未发布的Claude Mythos模型架构。 提出这个项目的是22岁的开发者凯·戈麦斯…


• [商汤医疗再获超 5 亿元融资,估值突破 10 亿美元,领跑全球医疗世界模型赛道 | 极客公园](https://www.geekpark.net/news/362799)

商汤医疗近日完成了一轮超过五亿元人民币的战略融资。 公司估值也正式突破了十亿美元。 这轮融资由多家知名产业资本和投资机构联合参与…


==========================================================