一、70B参数大模型的基础内存占用 70B(700亿参数)大模型在推理阶段的内存占用主要由三部分构成:模型权重存储、推理中间状态及系统开销。以FP16精度为例,单个参数占用2字节,70B参数的模型权重理论占用量为:70……