一、技术背景:AI模型轻量化的必然需求 1.1 大模型时代的性能困境 当前AI领域,以GPT-4、LLaMA为代表的大模型参数规模突破万亿,训练与推理成本呈指数级增长。例如,GPT-4的1.8万亿参数需3000张A100 GPU训练3个月……