不依赖任何框架，手写原生 DeepSeek Agent 工具调用（Function Calling）详解

一、为什么需要原生实现Function Calling？

在Agent开发场景中，工具调用（Function Calling）能力是连接LLM与外部系统的关键桥梁。当前主流方案依赖LangChain、LlamaIndex等框架，但这些框架存在以下问题：

黑箱效应：框架封装了底层协议，开发者难以理解工具调用的完整流程
性能损耗：多层抽象导致额外的序列化/反序列化开销
定制限制：框架的预设模式难以满足复杂业务场景的定制需求

原生实现的优势在于：

完全掌控消息协议和执行流程
减少不必要的中间层损耗
支持高度定制化的工具注册机制
便于与现有系统深度集成

二、Function Calling核心机制解析

1. 消息协议设计

工具调用的核心是LLM与Agent之间的结构化消息交互。关键字段包括：

{
  "messages": [
    {
      "role": "user",
      "content": "查询北京今天的天气"
    },
    {
      "role": "assistant",
      "function_call": {
        "name": "get_weather",
        "arguments": {
          "city": "北京",
          "date": "2023-07-20"
        }
      }
    }
  ]
}

协议设计要点：

明确区分用户消息与工具调用消息
工具参数需符合JSON Schema规范
支持嵌套参数结构（如address.city）

2. 工具注册系统实现

原生工具注册需要实现三个核心组件：

class ToolRegistry:
    def __init__(self):
        self.tools = {}
        self.schemas = {}
    def register(self, name, func, schema):
        """注册工具函数及其参数schema"""
        self.tools[name] = func
        self.schemas[name] = schema
    def get_tool(self, name):
        """获取工具函数"""
        return self.tools.get(name)
    def validate_args(self, name, args):
        """参数校验"""
        schema = self.schemas.get(name)
        # 实现JSON Schema验证逻辑
        return True  # 简化示例

工具Schema设计示例：

{
  "get_weather": {
    "type": "object",
    "properties": {
      "city": {"type": "string"},
      "date": {"type": "string", "format": "date"}
    },
    "required": ["city"]
  }
}

3. 工具调用执行流程

完整执行流程包含6个关键步骤：

消息解析：从LLM输出中提取function_call字段
参数校验：根据工具Schema验证参数有效性
工具查找：在注册表中定位对应的工具函数
参数转换：将JSON参数转换为函数调用参数
执行调用：同步/异步执行工具函数
结果包装：将执行结果转为LLM可理解的格式

关键代码实现：

def execute_function_call(registry, message):
    if "function_call" not in message:
        return None
    call = message["function_call"]
    tool_name = call["name"]
    tool_args = call["arguments"]
    # 参数校验
    if not registry.validate_args(tool_name, tool_args):
        raise ValueError("Invalid arguments")
    # 获取并执行工具
    tool = registry.get_tool(tool_name)
    if not tool:
        raise ValueError(f"Tool {tool_name} not found")
    # 参数转换（示例简化）
    args = convert_args(tool_args)  # 实现参数类型转换
    result = tool(*args)
    # 结果包装
    return {
        "role": "function",
        "name": tool_name,
        "content": str(result)
    }

三、高级功能实现

1. 异步工具支持

对于耗时操作（如API调用、数据库查询），需要实现异步工具调用：

import asyncio
class AsyncToolRegistry(ToolRegistry):
    async def execute_async(self, call):
        tool = self.get_tool(call["name"])
        if asyncio.iscoroutinefunction(tool):
            args = convert_args(call["arguments"])
            result = await tool(*args)
            return self._package_result(call["name"], result)
        return super().execute_function_call(call)

2. 工具调用链管理

复杂场景需要支持工具调用链：

class ToolChain:
    def __init__(self, registry):
        self.registry = registry
        self.history = []
    async def execute_chain(self, initial_input):
        current_input = initial_input
        while True:
            # 模拟LLM生成调用决策
            function_call = self._generate_call(current_input)
            if not function_call:
                break
            result = await self.registry.execute_async(function_call)
            self.history.append((function_call, result))
            current_input = result["content"]
        return self._aggregate_results()

3. 错误处理机制

完善的错误处理应包含：

工具不存在错误
参数校验错误
工具执行异常
结果解析错误

实现示例：

class ToolExecutionError(Exception):
    pass
def safe_execute(registry, call):
    try:
        return execute_function_call(registry, call)
    except KeyError as e:
        raise ToolExecutionError(f"Tool not found: {str(e)}")
    except ValueError as e:
        raise ToolExecutionError(f"Invalid arguments: {str(e)}")
    except Exception as e:
        raise ToolExecutionError(f"Tool execution failed: {str(e)}")

四、性能优化实践

1. 工具缓存策略

对于高频调用工具，实现结果缓存：

from functools import lru_cache
def register_cached_tool(registry, name, func, schema, cache_size=100):
    @lru_cache(maxsize=cache_size)
    def cached_func(*args):
        return func(*args)
    registry.register(name, cached_func, schema)

2. 批量工具调用

支持一次性调用多个工具：

async def batch_execute(registry, calls):
    tasks = []
    for call in calls:
        task = asyncio.create_task(registry.execute_async(call))
        tasks.append(task)
    return await asyncio.gather(*tasks)

3. 参数预处理优化

对常见参数进行预处理：

def preprocess_args(args):
    # 日期格式标准化
    if "date" in args:
        try:
            args["date"] = datetime.fromisoformat(args["date"]).date()
        except ValueError:
            pass
    # 其他预处理逻辑...
    return args

五、完整实现示例

import json
from datetime import datetime
class NativeDeepSeekAgent:
    def __init__(self):
        self.registry = ToolRegistry()
        self.message_history = []
    def register_tool(self, name, func, schema):
        self.registry.register(name, func, schema)
    async def call_function(self, function_call):
        try:
            result = await self.registry.execute_async(function_call)
            self.message_history.append(result)
            return result
        except ToolExecutionError as e:
            error_msg = {
                "role": "error",
                "content": str(e)
            }
            self.message_history.append(error_msg)
            return error_msg
    def get_context(self):
        return {
            "messages": self.message_history.copy(),
            "tools": list(self.registry.tools.keys())
        }
# 示例工具实现
async def get_weather(city, date=None):
    # 实际实现应调用天气API
    return {
        "city": city,
        "date": date or datetime.now().date(),
        "temperature": "25°C",
        "condition": "Sunny"
    }
# 使用示例
if __name__ == "__main__":
    agent = NativeDeepSeekAgent()
    # 注册工具
    weather_schema = {
        "type": "object",
        "properties": {
            "city": {"type": "string"},
            "date": {"type": "string", "format": "date"}
        },
        "required": ["city"]
    }
    agent.register_tool("get_weather", get_weather, weather_schema)
    # 模拟LLM输出
    function_call = {
        "role": "assistant",
        "function_call": {
            "name": "get_weather",
            "arguments": {
                "city": "北京",
                "date": "2023-07-20"
            }
        }
    }
    # 执行调用
    import asyncio
    result = asyncio.run(agent.call_function(function_call))
    print(json.dumps(result, indent=2))

六、最佳实践建议

工具设计原则：
- 每个工具应专注单一职责
- 参数设计遵循最小化原则
- 工具名称应具有明确语义
错误处理策略：
- 为关键工具实现重试机制
- 对第三方API调用设置超时
- 实现降级方案（如缓存结果）
性能优化方向：
- 对高频工具实现缓存
- 考虑工具执行结果的持久化
- 实现工具调用结果的增量更新
安全考虑：
- 实现严格的参数校验
- 对敏感工具添加权限控制
- 记录完整的工具调用日志

七、总结与展望

原生实现DeepSeek Agent工具调用系统，虽然需要更多的开发工作量，但能带来更高的灵活性和性能优势。通过本文介绍的协议设计、工具注册、执行流程等核心机制，开发者可以构建出完全符合业务需求的Agent系统。

未来发展方向包括：

更智能的工具调用决策机制
跨Agent的工具共享与复用
基于强化学习的工具链优化
多模态工具调用支持

这种原生实现方式特别适合对性能、定制化有极高要求的场景，以及需要深度集成现有系统的企业级应用。通过掌握这些核心原理，开发者可以摆脱框架的限制，构建出真正符合业务需求的智能Agent系统。

从零实现DeepSeek Agent工具调用：原生Function Calling全流程解析