一、大模型训练的时间都去哪儿了? 大模型训练的耗时问题常被归因于”算力不足”,但实际场景中,硬件利用率不足、数据传输延迟、并行效率低下等问题才是关键。例如,某主流云服务商的GPU集群在训练千亿参数模型时,……