混合推理技术崛起:大模型如何应对算力成本挑战? 一、算力成本:大模型发展的”阿喀琉斯之踵” 当前大模型训练与推理的算力需求呈现指数级增长。以GPT-3为例,其训练需要约3640PFLOPs计算量,相当于单台V100 GPU连……