260501 期|LLM context 的瓶颈

11 items in 3 sections

今日洞察

今天的内容有一条隐线贯穿始终:AI 竞争的 KPI 已经从训练算力切换到推理效率。HBM 内存带宽是上下文长度和推理成本的真正瓶颈,DeepSeek V4 的 token 效率创新、芯片财报和 Reiner Pope 的黑板讲座都在印证同一件事。

推理时代、算力与基础设施

从 OpenAI Stargate 到 Reiner Pope 的硬件推导,再到 AWS / Intel 财报,推理正在取代训练成为 AI 行业的新核心战场。

AI 编程、文化与科学边界

Karpathy、科学推理和多语言文化理解,分别从工程质量、科学发现和本地语境三个维度补齐今天的 AI 主题。

科学、教育与其他精选

非 AI 条目提供了认知调味:物理世界的反直觉、教育结构变化,以及信息输入质量本身的长期价值。

2026 / 2026-05 / Archive