深入理解Agent：从0实现Function Call

一、Agent与Function Call的底层逻辑

Agent系统的核心在于自主决策与工具调用能力，而Function Call正是实现这一能力的关键技术。其本质是让Agent能够动态识别任务需求，调用外部函数或API完成复杂操作。例如，在客服场景中，Agent需根据用户问题自动选择知识库查询、工单创建或人工转接等函数。

1.1 Function Call的技术定位

决策层：通过LLM（大语言模型）解析用户意图，生成可执行的函数签名
执行层：将函数参数转换为具体调用，处理异步响应与错误重试
反馈层：将执行结果转化为自然语言反馈，形成闭环

典型技术栈包括：

# 伪代码示例：Function Call决策流程
def decide_function(user_input):
    intent = llm_analyze(user_input)  # 意图识别
    if intent == "query_order":
        return {
            "function": "get_order_status",
            "params": {"order_id": extract_order_id(user_input)}
        }
    elif intent == "cancel_order":
        return {"function": "cancel_order", "params": {...}}

1.2 为什么需要自定义实现

现有框架（如LangChain、LlamaIndex）虽提供基础工具调用，但存在三大局限：

黑盒调用：无法深度定制参数校验逻辑
性能瓶颈：复杂场景下工具链调度效率低
安全风险：直接暴露内部API缺乏权限控制

二、从0实现Function Call的完整路径

2.1 架构设计三要素

函数注册中心：维护可用函数元数据（名称、参数、权限）

class FunctionRegistry:
    def __init__(self):
        self.functions = {}
    def register(self, name, func, schema):
        self.functions[name] = {
            "handler": func,
            "schema": schema  # 参数校验规则
        }

参数解析器：将自然语言转换为结构化参数
- 使用正则表达式提取关键信息
- 结合LLM进行模糊匹配（如”昨天”→具体日期）

执行控制器：管理异步调用与超时机制

async def execute_function(registry, call_spec):
    func_meta = registry.functions.get(call_spec["name"])
    if not func_meta:
        raise ValueError("Function not found")
    # 参数校验
    validated_params = validate_params(
        call_spec["params"], 
        func_meta["schema"]
    )
    # 异步执行
    try:
        result = await asyncio.wait_for(
            func_meta["handler"](**validated_params),
            timeout=10.0
        )
        return format_response(result)
    except Exception as e:
        return handle_error(e)

2.2 核心实现步骤

步骤1：定义函数契约

{
  "get_weather": {
    "description": "查询天气",
    "parameters": {
      "type": "object",
      "properties": {
        "city": {"type": "string"},
        "date": {"type": "string", "format": "date"}
      },
      "required": ["city"]
    }
  }
}

步骤2：实现参数绑定

def bind_parameters(raw_input, function_schema):
    # 1. 使用LLM提取候选参数
    llm_output = llm_extract(raw_input, function_schema)
    # 2. 类型转换与校验
    validated = {}
    for param, value in llm_output.items():
        schema = function_schema["parameters"]["properties"][param]
        if schema["type"] == "number":
            validated[param] = float(value)
        elif schema["type"] == "boolean":
            validated[param] = value.lower() in ("true", "1")
        else:
            validated[param] = str(value)
    return validated

步骤3：构建执行沙箱

使用asyncio实现并发控制
通过contextvars传递上下文（如用户身份）
实现熔断机制（如连续3次失败则暂停调用）

三、高级场景与优化实践

3.1 动态函数发现

在电商场景中，商品查询函数可能随业务扩展而变化。解决方案：

class DynamicRegistry(FunctionRegistry):
    def discover_functions(self, api_gateway):
        # 从API网关动态加载函数
        services = api_gateway.list_services()
        for service in services:
            self.register(
                service["name"],
                service["handler"],
                service["schema"]
            )

3.2 多模态参数处理

处理包含图片/语音的调用请求：

def handle_multimodal(input_data):
    if "image" in input_data:
        # 调用OCR服务提取文本
        text = ocr_service.extract(input_data["image"])
        return bind_parameters(text, current_schema)
    elif "audio" in input_data:
        # 语音转文本后处理
        ...

3.3 性能优化方案

缓存层：对频繁调用的函数（如汇率查询）实现结果缓存
批处理：合并同类函数调用（如批量查询订单状态）
服务网格：使用gRPC替代REST提升调用效率

四、安全与可靠性设计

4.1 权限控制体系

class FunctionGatekeeper:
    def __init__(self, auth_service):
        self.auth = auth_service
    def check_permission(self, user, function_name):
        # 检查用户是否有调用权限
        required_role = FUNCTION_ROLE_MAP.get(function_name)
        return self.auth.has_role(user, required_role)

4.2 异常处理机制

实现分级重试策略（网络错误重试3次，业务错误不重试）
记录完整的调用链用于问题排查
提供优雅的降级方案（如返回静态提示而非报错）

五、完整代码示例

import asyncio
from typing import Dict, Any
class AdvancedFunctionCaller:
    def __init__(self, registry, gatekeeper):
        self.registry = registry
        self.gatekeeper = gatekeeper
    async def call(self, user: Dict, function_name: str, raw_params: Dict) -> Dict:
        # 1. 权限校验
        if not self.gatekeeper.check_permission(user, function_name):
            return {"error": "Permission denied"}
        # 2. 获取函数元数据
        func_meta = self.registry.get(function_name)
        if not func_meta:
            return {"error": "Function not found"}
        # 3. 参数绑定与校验
        try:
            params = self._bind_params(raw_params, func_meta["schema"])
        except ValueError as e:
            return {"error": f"Invalid parameters: {str(e)}"}
        # 4. 执行调用
        try:
            result = await asyncio.wait_for(
                func_meta["handler"](**params),
                timeout=func_meta.get("timeout", 5.0)
            )
            return {"result": result}
        except asyncio.TimeoutError:
            return {"error": "Function call timed out"}
        except Exception as e:
            return {"error": f"Function failed: {str(e)}"}
    def _bind_params(self, raw_params: Dict, schema: Dict) -> Dict:
        # 实现参数类型转换、必填校验等逻辑
        validated = {}
        for param, value in raw_params.items():
            if param not in schema["properties"]:
                continue  # 或抛出异常
            prop_schema = schema["properties"][param]
            if "type" in prop_schema:
                if prop_schema["type"] == "number":
                    validated[param] = float(value)
                elif prop_schema["type"] == "integer":
                    validated[param] = int(value)
                else:
                    validated[param] = str(value)
        # 检查必填参数
        missing = [p for p in schema["required"] if p not in validated]
        if missing:
            raise ValueError(f"Missing required parameters: {', '.join(missing)}")
        return validated

六、部署与监控建议

指标收集：
- 函数调用成功率
- 平均响应时间
- 参数绑定错误率

日志规范：

{
  "timestamp": "2023-07-20T14:30:00Z",
  "function": "get_product_info",
  "user_id": "user_123",
  "params": {"product_id": "P1001"},
  "status": "success",
  "duration_ms": 452
}

告警策略：
- 连续5次调用失败触发告警
- 平均响应时间超过阈值时缩容

通过本文的完整实现方案，开发者可以构建出既灵活又可靠的Function Call系统，为Agent赋予真正的工具使用能力。实际开发中建议先实现核心调用流程，再逐步完善安全、监控等周边功能。

从零构建Agent：解锁Function Call的底层逻辑与实践