一、芯片架构革新:80亿参数模型推理速度突破每秒1.7万Token 某芯片研发团队近期公布新一代AI加速器架构,在80亿参数规模的语言模型推理场景中实现每秒1.7万Token的吞吐量。该突破主要得益于三项技术创新: 混合……