谷歌在Cloud Next 2026大会上发布了第八代TPU的两款独立芯片——TPU 8t(训练)与TPU 8i(推理),这是谷歌历史上首次将训练与推理任务拆分至独立芯片,标志着AI基础设施从“通用加速器时代”正式进入“分工时代”。
这一战略转向的本质是对AI计算特性分化的深刻洞察:训练任务追求极致吞吐量与规模扩展,推理任务则对延迟和并发更为敏感,单一芯片无法同时满足两种需求的成本最优解。谷歌同时展示了软硬件一体的完整AI基础设施体系:通过Axion CPU消除主机瓶颈,通过Virgo网络(带宽提升4倍)和Boardfly拓扑(跳数减少56%)重构互联架构,通过JAX和Pathways将分布式训练扩展至单一集群超过100万颗TPU芯片。