Python调用DeepSeek API详细教程：从流式传输到实战技巧——附代码示例

一、环境准备与基础配置

1.1 安装依赖库

使用DeepSeek API前需安装核心依赖库requests（HTTP请求）和websocket-client（流式传输）。推荐通过虚拟环境管理依赖：

python -m venv deepseek_env
source deepseek_env/bin/activate  # Linux/Mac
# 或 deepseek_env\Scripts\activate (Windows)
pip install requests websocket-client

1.2 获取API密钥

登录DeepSeek开发者平台，在「API管理」页面创建应用并获取API_KEY和API_SECRET。建议将密钥存储在环境变量中：

import os
os.environ['DEEPSEEK_API_KEY'] = 'your_api_key_here'
os.environ['DEEPSEEK_API_SECRET'] = 'your_api_secret_here'

二、基础API调用方法

2.1 文本生成示例

通过POST /v1/completions接口实现基础文本生成：

import requests
import json
def generate_text(prompt, model="deepseek-chat"):
    url = "https://api.deepseek.com/v1/completions"
    headers = {
        "Content-Type": "application/json",
        "Authorization": f"Bearer {os.getenv('DEEPSEEK_API_KEY')}"
    }
    data = {
        "model": model,
        "prompt": prompt,
        "max_tokens": 200,
        "temperature": 0.7
    }
    response = requests.post(url, headers=headers, data=json.dumps(data))
    return response.json()
# 示例调用
result = generate_text("解释量子计算的基本原理")
print(result['choices'][0]['text'])

2.2 参数详解

model: 指定模型版本（如deepseek-7b、deepseek-chat）
max_tokens: 控制生成文本长度（建议100-2000）
temperature: 创造力参数（0.1-1.0，值越高越随机）
top_p: 核采样阈值（0.8-0.95推荐）

三、流式传输实现

3.1 WebSocket流式传输

对于长文本生成，使用WebSocket实现实时输出：

import websocket
import json
def stream_generate(prompt):
    ws_url = "wss://api.deepseek.com/v1/stream/completions"
    headers = {
        "Authorization": f"Bearer {os.getenv('DEEPSEEK_API_KEY')}"
    }
    def on_message(ws, message):
        data = json.loads(message)
        if 'choices' in data:
            delta = data['choices'][0]['delta']
            if 'content' in delta:
                print(delta['content'], end='', flush=True)
    def on_error(ws, error):
        print(f"WebSocket错误: {error}")
    ws = websocket.WebSocketApp(
        ws_url,
        header=headers,
        on_message=on_message,
        on_error=on_error
    )
    request_data = {
        "model": "deepseek-chat",
        "prompt": prompt,
        "stream": True
    }
    ws.on_open = lambda ws: ws.send(json.dumps(request_data))
    ws.run_forever()
# 示例调用
stream_generate("写一首关于春天的七言绝句")

3.2 SSE（Server-Sent Events）方案

若服务支持SSE，可使用更简单的实现：

import requests
def sse_stream(prompt):
    url = "https://api.deepseek.com/v1/sse/completions"
    headers = {
        "Accept": "text/event-stream",
        "Authorization": f"Bearer {os.getenv('DEEPSEEK_API_KEY')}"
    }
    params = {
        "model": "deepseek-chat",
        "prompt": prompt,
        "stream": True
    }
    with requests.get(url, headers=headers, params=params, stream=True) as r:
        for line in r.iter_lines():
            if line:
                decoded = line.decode('utf-8')
                if 'data:' in decoded:
                    content = decoded.split('data: ')[1].strip()
                    if content != '[DONE]':
                        print(json.loads(content)['choices'][0]['text'], end='', flush=True)
# 示例调用
sse_stream("用Python写一个快速排序算法")

四、实战优化技巧

4.1 请求重试机制

网络不稳定时实现自动重试：

from requests.adapters import HTTPAdapter
from urllib3.util.retry import Retry
def create_session():
    session = requests.Session()
    retries = Retry(
        total=3,
        backoff_factor=1,
        status_forcelist=[500, 502, 503, 504]
    )
    session.mount('https://', HTTPAdapter(max_retries=retries))
    return session
# 使用示例
session = create_session()
response = session.post(url, headers=headers, data=json.dumps(data))

4.2 批量请求处理

合并多个短请求提升效率：

def batch_generate(prompts):
    url = "https://api.deepseek.com/v1/batch/completions"
    data = {
        "requests": [
            {"prompt": p, "max_tokens": 100} for p in prompts
        ]
    }
    response = requests.post(url, headers=headers, data=json.dumps(data))
    return response.json()
# 示例调用
results = batch_generate(["问题1", "问题2", "问题3"])

4.3 性能监控

添加请求耗时统计：

import time
def timed_generate(prompt):
    start = time.time()
    result = generate_text(prompt)
    elapsed = time.time() - start
    print(f"\n请求耗时: {elapsed:.2f}秒")
    return result
# 示例调用
timed_generate("分析Python装饰器的使用场景")

五、常见问题解决方案

5.1 连接超时处理

import socket
from requests.packages.urllib3.util.connection import allowed_gai_family
# 限制为IPv4
socket.gai_family = socket.AF_INET
requests.packages.urllib3.util.connection.allowed_gai_family = lambda: socket.AF_INET

5.2 速率限制应对

from time import sleep
def rate_limited_call(func, max_calls=10, period=60):
    import time
    from collections import deque
    call_times = deque(maxlen=max_calls)
    def wrapper(*args, **kwargs):
        now = time.time()
        call_times.append(now)
        # 计算窗口内调用次数
        oldest = now - period
        while call_times and call_times[0] < oldest:
            call_times.popleft()
        if len(call_times) >= max_calls:
            elapsed = now - call_times[0]
            sleep_time = period - elapsed
            if sleep_time > 0:
                sleep(sleep_time)
        return func(*args, **kwargs)
    return wrapper
# 使用示例
@rate_limited_call(max_calls=5, period=10)
def limited_generate(prompt):
    return generate_text(prompt)

六、完整项目示例

6.1 智能问答系统

class DeepSeekQA:
    def __init__(self):
        self.api_key = os.getenv('DEEPSEEK_API_KEY')
        self.session = create_session()
    def ask(self, question, stream=False):
        url = "https://api.deepseek.com/v1/completions"
        if stream:
            url = url.replace('/completions', '/stream/completions')
        headers = {
            "Content-Type": "application/json",
            "Authorization": f"Bearer {self.api_key}"
        }
        data = {
            "model": "deepseek-chat",
            "prompt": f"问题: {question}\n答案:",
            "max_tokens": 300,
            "temperature": 0.3
        }
        if stream:
            return self._stream_response(url, headers, data)
        else:
            return self._sync_response(url, headers, data)
    def _sync_response(self, url, headers, data):
        response = self.session.post(url, headers=headers, data=json.dumps(data))
        return response.json()
    def _stream_response(self, url, headers, data):
        # 实现类似前面的流式处理逻辑
        pass
# 使用示例
qa = DeepSeekQA()
answer = qa.ask("Python中如何实现多线程？")
print(answer)

七、最佳实践建议

模型选择：根据任务复杂度选择模型，简单问答用deepseek-7b，创意写作用deepseek-chat
参数调优：
- 事实性查询：temperature=0.1-0.3
- 创意写作：temperature=0.7-0.9
错误处理：实现完整的异常捕获链
日志记录：记录请求参数和响应状态
缓存机制：对重复问题实现结果缓存

通过本文的详细指导，开发者可以快速掌握DeepSeek API的调用技巧，从基础集成到高级流式传输实现，构建高效稳定的AI应用。实际开发中建议结合具体业务场景进行参数调优和架构设计。

Python调用DeepSeek API全攻略：流式传输与高效开发指南