利用Python调用百度千帆大模型接口实战指南

一、环境准备与API权限获取

1.1 开发环境配置

调用百度千帆大模型API前需确保Python环境满足要求：

Python版本：推荐3.7及以上（支持异步请求库aiohttp）

依赖库安装：

pip install requests aiohttp json5  # 同步/异步请求均需json5解析特殊响应

网络环境：确保服务器可访问百度智能云API域名（如qianfan.baidubce.com）

1.2 API密钥获取流程

登录百度智能云控制台
进入「千帆大模型平台」→「API管理」
创建AccessKey（需绑定项目并开通大模型服务）
安全存储AK/SK（建议使用环境变量或密钥管理服务）

安全提示：

禁止将密钥硬编码在代码中
生产环境建议使用IAM子账号+最小权限策略

二、同步调用模式实现

2.1 基础请求结构

import requests
import json5
def call_qianfan_sync(api_key, secret_key, prompt, model="ERNIE-3.5-Turbo"):
    # 1. 生成鉴权签名（简化示例，实际需按百度文档生成）
    auth_header = {
        "X-BD-API-KEY": api_key,
        "X-BD-TIMESTAMP": str(int(time.time())),
        # 实际需计算HMAC-SHA256签名
    }
    # 2. 构造请求体
    payload = {
        "model": model,
        "messages": [{"role": "user", "content": prompt}],
        "temperature": 0.7,
        "max_tokens": 2048
    }
    # 3. 发送请求
    url = "https://qianfan.baidubce.com/openapi/v1/chat/completions"
    response = requests.post(
        url,
        headers=auth_header,
        json=payload,
        timeout=30
    )
    # 4. 处理响应
    if response.status_code == 200:
        return json5.loads(response.text)["result"]
    else:
        raise Exception(f"API Error: {response.status_code} - {response.text}")

2.2 关键参数说明

参数	类型	说明
`model`	string	模型名称（如ERNIE-4.0-Turbo、QianFan-Lite等）
`messages`	list	对话历史，支持`system`/`user`/`assistant`角色
`temperature`	float	0-1控制创造性（0.1保守，0.9创新）
`top_p`	float	核采样阈值（0.8-0.95推荐）
`stop`	list	停止生成标记（如`["\n"]`）

三、异步调用优化实践

3.1 异步请求实现

import aiohttp
import asyncio
async def call_qianfan_async(api_key, prompt):
    async with aiohttp.ClientSession() as session:
        headers = {
            "X-BD-API-KEY": api_key,
            "Content-Type": "application/json"
        }
        data = {
            "model": "ERNIE-4.0-Turbo",
            "messages": [{"role": "user", "content": prompt}]
        }
        async with session.post(
            "https://qianfan.baidubce.com/openapi/v1/chat/completions",
            headers=headers,
            json=data
        ) as response:
            return await response.json()
# 批量调用示例
async def batch_process(prompts):
    tasks = [call_qianfan_async("YOUR_API_KEY", p) for p in prompts]
    results = await asyncio.gather(*tasks)
    return results

3.2 性能优化策略

连接池复用：使用aiohttp.TCPConnector(limit=100)控制并发
请求合并：对于短文本，可通过batch_messages参数合并请求
流式响应：启用stream=True实现逐token返回（需处理chunked数据）

四、高级功能实现

4.1 函数调用（Function Calling）

def call_with_functions(api_key, user_query):
    messages = [
        {"role": "system", "content": "你是数据分析助手，可调用以下工具："},
        {"role": "user", "content": user_query}
    ]
    functions = [
        {
            "name": "calculate_stats",
            "description": "计算数据的统计指标",
            "parameters": {
                "type": "object",
                "properties": {
                    "data": {"type": "array", "items": {"type": "number"}},
                    "metric": {"type": "string", "enum": ["mean", "median", "std"]}
                },
                "required": ["data", "metric"]
            }
        }
    ]
    payload = {
        "model": "ERNIE-4.0-Turbo",
        "messages": messages,
        "functions": functions,
        "function_call": "auto"  # 或指定函数名
    }
    response = requests.post(
        "https://qianfan.baidubce.com/openapi/v1/chat/completions",
        headers={"X-BD-API-KEY": api_key},
        json=payload
    )
    return response.json()

4.2 长文本处理技巧

分块策略：
- 使用max_tokens控制单次响应长度
- 通过system消息设置上下文窗口限制

检索增强生成（RAG）：

def rag_pipeline(api_key, query, knowledge_base):
    # 1. 检索相关文档
    relevant_docs = retrieve_documents(query, knowledge_base)
    # 2. 构造带上下文的prompt
    context = "\n".join([f"文档{i+1}:\n{doc}" for i, doc in enumerate(relevant_docs)])
    prompt = f"根据以下信息回答问题：\n{context}\n\n问题：{query}"
    # 3. 调用API
    return call_qianfan_sync(api_key, prompt)

五、错误处理与最佳实践

5.1 常见错误码处理

错误码	原因	解决方案
401	鉴权失败	检查AK/SK及签名算法
429	QPS超限	申请配额提升或实现指数退避
500	服务端错误	捕获异常并实现重试机制
503	模型加载中	切换备用模型或等待

5.2 生产环境建议

重试机制：

from tenacity import retry, stop_after_attempt, wait_exponential
@retry(stop=stop_after_attempt(3), wait=wait_exponential(multiplier=1))
def robust_call(api_key, prompt):
    return call_qianfan_sync(api_key, prompt)

日志记录：
- 记录完整请求/响应（脱敏处理）
- 监控API延迟和错误率
降级策略：
- 配置备用模型（如QianFan-Lite）
- 实现缓存层（对重复问题）

六、完整示例项目结构

qianfan_demo/
├── config.py          # 配置管理（API_KEY等）
├── api_client.py      # 封装调用逻辑
├── models/
│   └── prompts.py     # Prompt工程模板
├── utils/
│   ├── retry.py        # 重试装饰器
│   └── logger.py       # 日志配置
└── main.py            # 入口程序

结语：通过本文的实战指南，开发者可系统掌握百度千帆大模型API的调用技巧。建议从同步调用开始，逐步实现异步优化和高级功能。实际开发中需特别注意错误处理和性能调优，建议参考百度千帆官方文档获取最新接口规范。

利用Python调用百度千帆大模型接口全攻略

利用Python调用百度千帆大模型接口实战指南

一、环境准备与API权限获取

1.1 开发环境配置

1.2 API密钥获取流程

二、同步调用模式实现

2.1 基础请求结构

2.2 关键参数说明

三、异步调用优化实践

3.1 异步请求实现

3.2 性能优化策略

四、高级功能实现

4.1 函数调用（Function Calling）

4.2 长文本处理技巧

五、错误处理与最佳实践

5.1 常见错误码处理

5.2 生产环境建议

六、完整示例项目结构