一、背景与研究动机 随着大语言模型(LLM)在工业场景的深度应用,推理服务的性能与成本成为关键考量。Rust语言凭借其内存安全特性与零成本抽象优势,逐渐成为高性能推理框架的热门选择。本研究聚焦Qwen3模型在某……