一、技术架构设计:分层解耦与弹性扩展 本地大模型调用系统需兼顾性能与可维护性,推荐采用三层架构设计: API服务层:基于Spring WebFlux构建响应式接口,支持HTTP/gRPC双协议接入。通过@RestController注解定义……