一、技术选型与架构设计 1.1 核心组件选择 构建HTTP并发推理服务需涵盖以下基础组件: Web框架:选择轻量级异步框架(如FastAPI/Sanic),支持ASGI标准以实现高并发 模型加载:采用动态加载机制(如HuggingFace T……