一、技术背景与需求分析

随着生成式AI技术的快速发展，本地化部署大模型成为开发者的重要需求。Ollama作为新兴的模型运行框架，通过容器化技术简化了模型部署流程。DeepSeek系列模型凭借其高效的推理能力和开源特性，在学术研究和轻量级应用开发中广受关注。本教程针对Windows 11系统环境，提供从零开始的完整部署方案。

1.1 部署场景价值

本地化隐私保护：敏感数据无需上传云端
离线推理能力：保障关键业务连续性
定制化开发：支持模型微调与领域适配
成本优化：避免云服务持续计费

1.2 系统要求验证

Windows 11 21H2及以上版本
至少16GB内存（推荐32GB）
支持AVX2指令集的CPU
预留50GB以上磁盘空间
NVIDIA GPU（可选，需CUDA 11.8+）

二、Ollama框架安装指南

2.1 依赖环境准备

2.1.1 WSL2配置（推荐）

# 以管理员身份运行PowerShell
wsl --install -d Ubuntu-22.04
wsl --set-default-version 2
wsl --set-default Ubuntu-22.04

配置完成后重启系统，通过wsl -l验证安装状态。

2.1.2 Docker Desktop安装

下载Docker Desktop for Windows
启用WSL2后端支持
配置资源限制：
- 内存：8GB+
- CPU：4核+
- 交换空间：2GB

2.2 Ollama核心安装

2.2.1 官方包安装

访问Ollama官网下载Windows版本安装包，运行后自动完成：

服务进程注册
环境变量配置
防火墙规则设置

2.2.2 验证安装

# 检查服务状态
Get-Service -Name OllamaService
# 测试命令行
ollama --version
# 应输出类似：ollama version 0.1.25

2.3 高级配置

2.3.1 模型存储路径修改

编辑C:\Program Files\Ollama\.ollama\config.json：

{
  "models": "D:\\ollama_models",
  "gpu": true
}

2.3.2 GPU加速配置

安装NVIDIA CUDA Toolkit 12.2
配置Ollama使用CUDA：
```
ollama serve --gpu-id 0
```

三、DeepSeek模型部署流程

3.1 模型拉取与配置

3.1.1 基础模型部署

# 拉取DeepSeek-R1-7B模型
ollama pull deepseek-ai/DeepSeek-R1:7b
# 查看模型信息
ollama show deepseek-ai/DeepSeek-R1:7b

3.1.2 自定义参数配置

创建custom.json文件：

{
  "MODEL": "deepseek-ai/DeepSeek-R1",
  "PARAMETERS": {
    "temperature": 0.7,
    "top_p": 0.9,
    "max_tokens": 2048
  }
}

通过ollama create mydeepseek -f custom.json创建自定义实例。

3.2 API服务搭建

3.2.1 启动RESTful服务

# 启动带API的服务
ollama serve --api-port 11434
# 验证API
Invoke-RestMethod -Uri "http://localhost:11434/api/generate" -Method Post -Body @{
  "model": "deepseek-ai/DeepSeek-R1:7b",
  "prompt": "解释量子计算的基本原理"
} -ContentType "application/json"

3.2.2 gRPC服务配置

生成protobuf定义文件
编译生成客户端代码
通过gRPC通道调用模型服务

四、性能优化与问题排查

4.1 内存优化策略

启用4bit量化：

ollama pull deepseek-ai/DeepSeek-R1:7b --quantize q4_k_m

设置交换分区：

# 创建虚拟内存页面文件
wsl -d docker-desktop -e sudo fallocate -l 16G /swapfile
wsl -d docker-desktop -e sudo chmod 600 /swapfile
wsl -d docker-desktop -e sudo mkswap /swapfile
wsl -d docker-desktop -e sudo swapon /swapfile

4.2 常见问题解决方案

4.2.1 模型加载失败

检查SHA256校验和：

Get-FileHash -Path ".\models\deepseek-ai_DeepSeek-R1_7b.ollama" -Algorithm SHA256

验证模型完整性：

ollama verify deepseek-ai/DeepSeek-R1:7b

4.2.2 GPU加速异常

确认驱动版本：

nvidia-smi --query-gpu=driver_version --format=csv

检查CUDA兼容性：
```
nvcc --version
```

五、生产环境部署建议

5.1 容器化部署方案

FROM ollama/ollama:latest
RUN ollama pull deepseek-ai/DeepSeek-R1:7b
CMD ["ollama", "serve", "--api-port", "11434"]

构建命令：

docker build -t deepseek-service .
docker run -d -p 11434:11434 --gpus all deepseek-service

5.2 监控体系搭建

Prometheus指标采集：

# prometheus.yml配置片段
scrape_configs:
- job_name: 'ollama'
 static_configs:
   - targets: ['localhost:11434']
 metrics_path: '/metrics'

Grafana仪表盘配置：
- 推理延迟监控
- 内存使用趋势
- 请求吞吐量

5.3 安全加固措施

启用TLS加密：
```powershell

生成自签名证书

openssl req -x509 -newkey rsa:4096 -keyout key.pem -out cert.pem -days 365

启动HTTPS服务

ollama serve —tls-cert cert.pem —tls-key key.pem

2. 实施API鉴权：
```powershell
# 生成JWT密钥
$jwtSecret = [System.Convert]::ToBase64String([System.Text.Encoding]::UTF8.GetBytes("your-256-bit-secret"))
# 配置中间件
# （需自定义API网关实现）

本教程系统阐述了Windows 11环境下通过Ollama框架部署DeepSeek模型的全流程，涵盖从基础环境搭建到生产级优化的完整路径。通过分步骤的详细说明和可验证的代码示例，帮助开发者快速构建本地化AI推理服务。实际部署时建议结合具体业务场景进行参数调优和安全加固，以获得最佳运行效果。

Win11系统下Ollama安装与DeepSeek部署全攻略