Spring AI入门：从零搭建智能问答初级案例

一、Spring AI技术背景与核心价值

Spring AI是Spring生态针对人工智能场景的扩展模块，旨在简化AI模型与Java应用的集成。其核心价值体现在三方面：

生态兼容性：无缝兼容Spring Boot/Cloud，开发者可利用现有技术栈快速构建AI应用；
模型抽象层：通过统一接口支持主流大模型（如LLM、多模态模型），降低模型切换成本；
工程化能力：内置请求路由、结果解析、异常处理等企业级功能，提升开发效率。

以智能问答场景为例，传统方案需手动处理模型调用、上下文管理、结果格式化等逻辑，而Spring AI通过注解驱动和配置化设计，可将开发周期从数周缩短至数天。

二、环境准备与依赖配置

1. 开发环境要求

JDK 17+（推荐LTS版本）
Spring Boot 3.2+（支持Java 17+）
Maven 3.8+ 或 Gradle 8.0+
模型服务（如百度千帆大模型平台API）

2. 项目初始化

通过Spring Initializr（https://start.spring.io）生成项目，添加以下依赖：

<!-- Spring AI核心依赖 -->
<dependency>
    <groupId>org.springframework.ai</groupId>
    <artifactId>spring-ai-starter</artifactId>
    <version>0.7.0</version>
</dependency>
<!-- HTTP客户端（如调用远程模型服务） -->
<dependency>
    <groupId>org.springframework.boot</groupId>
    <artifactId>spring-boot-starter-web</artifactId>
</dependency>
<!-- 可选：OpenAI兼容层（如需调用本地模型） -->
<dependency>
    <groupId>org.springframework.ai</groupId>
    <artifactId>spring-ai-openai-spring-boot-starter</artifactId>
    <version>0.7.0</version>
</dependency>

3. 配置模型服务

在application.yml中配置模型服务参数（以某云厂商API为例）：

spring:
  ai:
    chat:
      endpoint: https://api.example.com/v1/chat/completions
      api-key: YOUR_API_KEY
      model: qianwen-7b  # 示例模型名

三、核心功能实现

1. 基础问答服务

步骤1：定义请求/响应DTO

public record ChatRequest(String prompt, String userId) {}
public record ChatResponse(String answer, List<String> references) {}

步骤2：创建AI服务类

@Service
public class AiChatService {
    private final ChatClient chatClient;
    public AiChatService(ChatClient chatClient) {
        this.chatClient = chatClient;
    }
    public ChatResponse ask(ChatRequest request) {
        ChatMessage userMessage = ChatMessage.builder()
            .role(ChatMessageRole.USER)
            .content(request.prompt())
            .build();
        ChatCompletionRequest completionRequest = ChatCompletionRequest.builder()
            .messages(List.of(userMessage))
            .model("qianwen-7b")  # 与配置文件保持一致
            .build();
        ChatCompletionResponse response = chatClient.call(completionRequest);
        String answer = response.getChoices().get(0).getMessage().getContent();
        return new ChatResponse(answer, extractReferences(answer));
    }
    private List<String> extractReferences(String text) {
        // 实现参考文献提取逻辑
        return List.of();
    }
}

步骤3：创建REST控制器

@RestController
@RequestMapping("/api/chat")
public class ChatController {
    private final AiChatService aiChatService;
    public ChatController(AiChatService aiChatService) {
        this.aiChatService = aiChatService;
    }
    @PostMapping
    public ResponseEntity<ChatResponse> chat(@RequestBody ChatRequest request) {
        ChatResponse response = aiChatService.ask(request);
        return ResponseEntity.ok(response);
    }
}

2. 上下文管理优化

通过Conversation对象维护多轮对话状态：

@Service
public class ContextAwareChatService {
    private final ChatClient chatClient;
    private final Map<String, List<ChatMessage>> conversationHistory = new ConcurrentHashMap<>();
    public ChatResponse ask(String userId, String prompt) {
        List<ChatMessage> history = conversationHistory.computeIfAbsent(userId, k -> new ArrayList<>());
        history.add(ChatMessage.builder()
            .role(ChatMessageRole.USER)
            .content(prompt)
            .build());
        ChatCompletionRequest request = ChatCompletionRequest.builder()
            .messages(history)
            .build();
        ChatCompletionResponse response = chatClient.call(request);
        ChatMessage aiMessage = response.getChoices().get(0).getMessage();
        history.add(aiMessage);
        return new ChatResponse(aiMessage.getContent(), List.of());
    }
}

四、性能优化与最佳实践

1. 异步处理设计

使用@Async实现非阻塞调用：

@Service
public class AsyncChatService {
    @Async
    public CompletableFuture<ChatResponse> askAsync(ChatRequest request) {
        // 同步调用逻辑...
        return CompletableFuture.completedFuture(response);
    }
}
// 启用异步需在主类添加@EnableAsync

2. 缓存策略

通过Caffeine缓存高频问题：

@Configuration
public class CacheConfig {
    @Bean
    public Cache<String, ChatResponse> chatCache() {
        return Caffeine.newBuilder()
            .maximumSize(1000)
            .expireAfterWrite(10, TimeUnit.MINUTES)
            .build();
    }
}
@Service
public class CachedChatService {
    private final Cache<String, ChatResponse> cache;
    private final AiChatService aiChatService;
    public ChatResponse askWithCache(ChatRequest request) {
        String cacheKey = request.userId() + ":" + request.prompt();
        return cache.get(cacheKey, key -> aiChatService.ask(request));
    }
}

3. 错误处理机制

自定义异常处理器：

@ControllerAdvice
public class AiExceptionHandler {
    @ExceptionHandler(AiServiceException.class)
    public ResponseEntity<ErrorResponse> handleAiException(AiServiceException e) {
        ErrorResponse error = new ErrorResponse(
            "AI_SERVICE_ERROR", 
            e.getMessage(),
            e.getErrorCode()
        );
        return ResponseEntity.status(503).body(error);
    }
}

五、部署与监控

1. 日志配置

在logback-spring.xml中添加AI调用日志：

<logger name="org.springframework.ai" level="DEBUG"/>

2. 指标监控

通过Micrometer收集AI调用指标：

@Bean
public MeterRegistryCustomizer<MeterRegistry> metricsCommonTags() {
    return registry -> registry.config().commonTags("ai.service", "qianwen");
}

六、进阶方向建议

多模型路由：根据问题类型动态选择不同模型（如文本生成用LLM，数学题用专用模型）；
安全加固：实现输入过滤、输出审核机制；
边缘计算：结合百度智能云边缘节点实现低延迟响应。

通过本文案例，开发者可快速掌握Spring AI的核心开发模式，后续可结合具体业务场景扩展功能模块。建议参考Spring AI官方文档（https://spring.io/projects/spring-ai）获取最新特性更新。