260501 期｜LLM context 的瓶颈

11 items in 3 sections

今日洞察

今天的内容有一条隐线贯穿始终：AI 竞争的 KPI 已经从训练算力切换到推理效率。HBM 内存带宽是上下文长度和推理成本的真正瓶颈，DeepSeek V4 的 token 效率创新、芯片财报和 Reiner Pope 的黑板讲座都在印证同一件事。

从 OpenAI Stargate 到 Reiner Pope 的硬件推导，再到 AWS / Intel 财报，推理正在取代训练成为 AI 行业的新核心战场。

Stargate：为智能时代构建算力基础设施订阅专享

OpenAI / blog ★★★☆☆ · 🍅

OpenAI 持续扩展 Stargate 项目算力基础设施，以支撑 AGI 驱动下快速增长的 AI 需求。

ai 硬件
How GPT-5, Claude, and Gemini are actually trained and served 订阅专享

Reiner Pope / YouTube ★★★★☆ · 🍅🍅

关于 GPT-5、Claude、Gemini 训练与推理底层机制的黑板讲解，内容密度极高，涉及 batch size、MoE、内存层级和 API 定价反推。
Amazon Earnings: Trainium 的赌注开始兑现订阅专享

Ben Thompson / blog ★★★★☆ · 🍅🍅

AI 从训练转向推理和 Agent 的结构性转变，让 AWS 对自研芯片 Trainium 的赌注开始兑现。
Intel Earnings: AI 需求正在结构性重塑 CPU 市场订阅专享

Ben Thompson / blog

Intel 财报超预期，但核心驱动是 AI 对 CPU 产生的结构性需求转移，而非传统算力竞争。
GPT-5 的“小妖精”是怎么来的？订阅专享

OpenAI / blog

罕见的透明度报告，详细复盘 GPT-5 中异常人格化输出的来源时间线、根因分析与修复方案。

Karpathy、科学推理和多语言文化理解，分别从工程质量、科学发现和本地语境三个维度补齐今天的 AI 主题。

Karpathy：Vibe Coding 只是起点，Agentic Engineering 才是未来订阅专享

宝玉 / blog

Karpathy 最新观点：AI 编程下一步不是写得更快，而是用 Agentic Engineering 守住软件质量。
哈萨比斯的难题：AI 能推导出广义相对论吗？订阅专享

公众号

训练数据截止 1911 年的模型，能否自主推导出 1915 年爱因斯坦的广义相对论？这道题正在重新丈量 AI 科学推理能力的边界。
顶尖大模型真的理解“本地文化”吗？订阅专享

Jian Gang Ngui / YouTube

AI Singapore 模型开发负责人探讨：前沿大模型在多语言、多文化场景下的真实能力局限，足够智能不等于真正理解本地语境。

非 AI 条目提供了认知调味：物理世界的反直觉、教育结构变化，以及信息输入质量本身的长期价值。

反物质是什么？有没有负质量？订阅专享

公众号

澄清反物质等于负质量的常见误解，解释正反物质湮灭的真实物理机制。
比光还快的是什么？是黑暗订阅专享

Adam Kovac / blog

最新实验发现光波中的单个暗点移动速度可超过光波本身。这并不违反相对论，因为信息并未真正传递。
中国高校五年撤销 5000 多个专业订阅专享

刘亚宁 / 公众号

五年间超 5000 个专业停招，高校专业调整折射产业与就业结构的深层变迁。