一、测试背景与目标 大模型推理阶段的核心瓶颈在于Token生成效率,尤其在长文本生成、实时交互等场景中,低延迟与高吞吐量直接决定用户体验。PyTorch-v2.8作为主流深度学习框架,其动态计算图特性与硬件适配能力对……