引言:规模与效率的再思考 在人工智能领域,”规模即正义”已成为普遍认知。GPT-3(175B参数)、PaLM(540B参数)等超大规模模型通过海量参数堆砌实现了惊人的语言理解能力,但随之而来的训练成本(数百万美元)、推……