260501 期|LLM context 的瓶颈
今日洞察
今天的内容有一条隐线贯穿始终:AI 竞争的 KPI 已经从训练算力切换到推理效率。HBM 内存带宽是上下文长度和推理成本的真正瓶颈,DeepSeek V4 的 token 效率创新、芯片财报和 Reiner Pope 的黑板讲座都在印证同一件事。
推理时代、算力与基础设施
从 OpenAI Stargate 到 Reiner Pope 的硬件推导,再到 AWS / Intel 财报,推理正在取代训练成为 AI 行业的新核心战场。
-
Stargate:为智能时代构建算力基础设施 订阅专享
OpenAI 持续扩展 Stargate 项目算力基础设施,以支撑 AGI 驱动下快速增长的 AI 需求。
-
How GPT-5, Claude, and Gemini are actually trained and served 订阅专享
关于 GPT-5、Claude、Gemini 训练与推理底层机制的黑板讲解,内容密度极高,涉及 batch size、MoE、内存层级和 API 定价反推。
-
Amazon Earnings: Trainium 的赌注开始兑现 订阅专享
AI 从训练转向推理和 Agent 的结构性转变,让 AWS 对自研芯片 Trainium 的赌注开始兑现。
-
Intel Earnings: AI 需求正在结构性重塑 CPU 市场 订阅专享
Intel 财报超预期,但核心驱动是 AI 对 CPU 产生的结构性需求转移,而非传统算力竞争。
-
GPT-5 的“小妖精”是怎么来的? 订阅专享
罕见的透明度报告,详细复盘 GPT-5 中异常人格化输出的来源时间线、根因分析与修复方案。
AI 编程、文化与科学边界
Karpathy、科学推理和多语言文化理解,分别从工程质量、科学发现和本地语境三个维度补齐今天的 AI 主题。
-
Karpathy:Vibe Coding 只是起点,Agentic Engineering 才是未来 订阅专享
Karpathy 最新观点:AI 编程下一步不是写得更快,而是用 Agentic Engineering 守住软件质量。
-
哈萨比斯的难题:AI 能推导出广义相对论吗? 订阅专享
训练数据截止 1911 年的模型,能否自主推导出 1915 年爱因斯坦的广义相对论?这道题正在重新丈量 AI 科学推理能力的边界。
-
顶尖大模型真的理解“本地文化”吗? 订阅专享
AI Singapore 模型开发负责人探讨:前沿大模型在多语言、多文化场景下的真实能力局限,足够智能不等于真正理解本地语境。
科学、教育与其他精选
非 AI 条目提供了认知调味:物理世界的反直觉、教育结构变化,以及信息输入质量本身的长期价值。
-
反物质是什么?有没有负质量? 订阅专享
澄清反物质等于负质量的常见误解,解释正反物质湮灭的真实物理机制。
-
比光还快的是什么?是黑暗 订阅专享
最新实验发现光波中的单个暗点移动速度可超过光波本身。这并不违反相对论,因为信息并未真正传递。
-
中国高校五年撤销 5000 多个专业 订阅专享
五年间超 5000 个专业停招,高校专业调整折射产业与就业结构的深层变迁。