大模型轻量化实践路径:从压缩到部署的全链路探索