使用 handoffs 构建客服 - Docs by LangChain中文

状态机模式描述的是这样一种工作流：agent 在任务的不同状态之间移动时，其行为也会随之变化。本教程展示如何通过工具调用动态更改单个 agent 的配置来实现状态机，也就是根据当前状态更新可用工具和指令。状态可以由多个来源确定：agent 过去的动作（工具调用）、外部状态（例如 API 调用结果），甚至初始用户输入（例如运行分类器来确定用户意图）。在本教程中，你将构建一个执行以下操作的客服 agent：

继续处理前收集保修信息。
将问题分类为硬件问题或软件问题。
提供解决方案，或升级给人工客服。
跨多个轮次维护对话状态。

不同于将 subagent 作为工具调用的 subagents 模式，状态机模式使用单个 agent，并根据工作流进度更改该 agent 的配置。每个“步骤”只是同一个底层 agent 的不同配置（系统 prompt + tools），并根据状态动态选择。下面是将要构建的工作流：

设置

安装

本教程需要 langchain 包：

pip install langchain

更多详情，请参阅安装指南。

LangSmith

设置 LangSmith，以检查 agent 内部发生了什么。然后设置以下环境变量：

export LANGSMITH_TRACING="true"
export LANGSMITH_API_KEY="..."

选择 LLM

从 LangChain 的集成套件中选择聊天模型：

👉 Read the OpenAI chat model integration docs

pip install -U "langchain[openai]"

import os
from langchain.chat_models import init_chat_model

os.environ["OPENAI_API_KEY"] = "sk-..."

model = init_chat_model("gpt-5.4")

👉 Read the Anthropic chat model integration docs

pip install -U "langchain[anthropic]"

import os
from langchain.chat_models import init_chat_model

os.environ["ANTHROPIC_API_KEY"] = "sk-..."

model = init_chat_model("claude-sonnet-4-6")

👉 Read the Azure chat model integration docs

pip install -U "langchain[openai]"

import os
from langchain.chat_models import init_chat_model

os.environ["AZURE_OPENAI_API_KEY"] = "..."
os.environ["AZURE_OPENAI_ENDPOINT"] = "..."
os.environ["OPENAI_API_VERSION"] = "2025-03-01-preview"

model = init_chat_model(
    "azure_openai:gpt-5.4",
    azure_deployment=os.environ["AZURE_OPENAI_DEPLOYMENT_NAME"],
)

👉 Read the Google GenAI chat model integration docs

pip install -U "langchain[google-genai]"

import os
from langchain.chat_models import init_chat_model

os.environ["GOOGLE_API_KEY"] = "..."

model = init_chat_model("google_genai:gemini-2.5-flash-lite")

👉 Read the AWS Bedrock chat model integration docs

pip install -U "langchain[aws]"

from langchain.chat_models import init_chat_model

# Follow the steps here to configure your credentials:
# https://docs.aws.amazon.com/bedrock/latest/userguide/getting-started.html

model = init_chat_model(
    "anthropic.claude-3-5-sonnet-20240620-v1:0",
    model_provider="bedrock_converse",
)

👉 Read the HuggingFace chat model integration docs

pip install -U "langchain[huggingface]"

import os
from langchain.chat_models import init_chat_model

os.environ["HUGGINGFACEHUB_API_TOKEN"] = "hf_..."

model = init_chat_model(
    "microsoft/Phi-3-mini-4k-instruct",
    model_provider="huggingface",
    temperature=0.7,
    max_tokens=1024,
)

👉 Read the OpenRouter chat model integration docs

pip install -U "langchain-openrouter"

import os
from langchain.chat_models import init_chat_model

os.environ["OPENROUTER_API_KEY"] = "sk-..."

model = init_chat_model(
    "auto",
    model_provider="openrouter",
)

1. 定义自定义状态

首先，定义一个自定义 state schema，用于跟踪当前活跃步骤：

from langchain.agents import AgentState
from typing_extensions import NotRequired
from typing import Literal

# 定义可能的工作流步骤
SupportStep = Literal["warranty_collector", "issue_classifier", "resolution_specialist"]

class SupportState(AgentState):
    """客服工作流的状态。"""
    current_step: NotRequired[SupportStep]
    warranty_status: NotRequired[Literal["in_warranty", "out_of_warranty"]]
    issue_type: NotRequired[Literal["hardware", "software"]]

current_step 字段是状态机模式的核心，它决定每一轮加载哪个配置（prompt + tools）。

2. 创建管理工作流状态的工具

创建用于更新工作流状态的工具。这些工具允许 agent 记录信息并转换到下一步。关键是使用 Command 更新状态，包括 current_step 字段：

from langchain.tools import tool, ToolRuntime
from langchain.messages import ToolMessage
from langgraph.types import Command

@tool
def record_warranty_status(
    status: Literal["in_warranty", "out_of_warranty"],
    runtime: ToolRuntime[None, SupportState],
) -> Command:
    """记录客户的保修状态，并转换到问题分类步骤。"""
    return Command(
        update={
            "messages": [
                ToolMessage(
                    content=f"保修状态已记录为：{status}",
                    tool_call_id=runtime.tool_call_id,
                )
            ],
            "warranty_status": status,
            "current_step": "issue_classifier",
        }
    )


@tool
def record_issue_type(
    issue_type: Literal["hardware", "software"],
    runtime: ToolRuntime[None, SupportState],
) -> Command:
    """记录问题类型，并转换到解决方案专家步骤。"""
    return Command(
        update={
            "messages": [
                ToolMessage(
                    content=f"问题类型已记录为：{issue_type}",
                    tool_call_id=runtime.tool_call_id,
                )
            ],
            "issue_type": issue_type,
            "current_step": "resolution_specialist",
        }
    )


@tool
def escalate_to_human(reason: str) -> str:
    """将工单升级给人工客服专家。"""
    # 在真实系统中，这会创建工单、通知员工等。
    return f"正在升级给人工客服。原因：{reason}"


@tool
def provide_solution(solution: str) -> str:
    """为客户问题提供解决方案。"""
    return f"已提供解决方案：{solution}"

请注意，record_warranty_status 和 record_issue_type 会返回 Command 对象，同时更新数据（warranty_status、issue_type）和 current_step。这就是状态机的工作方式：工具控制工作流进度。

3. 定义步骤配置

为每个步骤定义 prompt 和工具。首先，定义每个步骤的 prompt：

查看完整 prompt 定义

# 将 prompt 定义为常量，便于引用
WARRANTY_COLLECTOR_PROMPT = """你是帮助客户处理设备问题的客服 agent。

当前阶段：保修验证

在此步骤中，你需要：
1. 热情地问候客户
2. 询问客户的设备是否在保修期内
3. 使用 record_warranty_status 记录客户回答并进入下一步

保持自然、友好的对话风格。不要一次询问多个问题。"""

ISSUE_CLASSIFIER_PROMPT = """你是帮助客户处理设备问题的客服 agent。

当前阶段：问题分类
客户信息：保修状态为 {warranty_status}

在此步骤中，你需要：
1. 要求客户描述问题
2. 判断这是硬件问题（物理损坏、部件损坏）还是软件问题（app 崩溃、性能问题）
3. 使用 record_issue_type 记录分类并进入下一步

如果不清楚，请先提澄清问题，再进行分类。"""

RESOLUTION_SPECIALIST_PROMPT = """你是帮助客户处理设备问题的客服 agent。

当前阶段：解决方案
客户信息：保修状态为 {warranty_status}，问题类型为 {issue_type}

在此步骤中，你需要：
1. 对于软件问题：使用 provide_solution 提供故障排查步骤
2. 对于硬件问题：
   - 如果在保修期内：使用 provide_solution 说明保修维修流程
   - 如果超出保修期：使用 escalate_to_human 处理付费维修选项

解决方案要具体且有帮助。"""

然后使用字典将步骤名称映射到对应配置：

# 步骤配置：将步骤名称映射到（prompt、tools、required_state）
STEP_CONFIG = {
    "warranty_collector": {
        "prompt": WARRANTY_COLLECTOR_PROMPT,
        "tools": [record_warranty_status],
        "requires": [],
    },
    "issue_classifier": {
        "prompt": ISSUE_CLASSIFIER_PROMPT,
        "tools": [record_issue_type],
        "requires": ["warranty_status"],
    },
    "resolution_specialist": {
        "prompt": RESOLUTION_SPECIALIST_PROMPT,
        "tools": [provide_solution, escalate_to_human],
        "requires": ["warranty_status", "issue_type"],
    },
}

这种基于字典的配置让以下操作更容易：

一眼查看所有步骤
添加新步骤（添加另一个条目即可）
理解工作流依赖关系（requires 字段）
使用带状态变量的 prompt 模板（例如 {warranty_status}）

4. 创建基于步骤的 middleware

创建 middleware，从 state 读取 current_step 并应用合适的配置。这里使用 @wrap_model_call decorator 来保持实现简洁：

from langchain.agents.middleware import wrap_model_call, ModelRequest, ModelResponse
from typing import Callable


@wrap_model_call
def apply_step_config(
    request: ModelRequest,
    handler: Callable[[ModelRequest], ModelResponse],
) -> ModelResponse:
    """根据当前步骤配置 agent 行为。"""
    # 获取当前步骤（首次交互默认使用 warranty_collector）
    current_step = request.state.get("current_step", "warranty_collector")

    # 查找步骤配置
    stage_config = STEP_CONFIG[current_step]

    # 验证必需状态是否存在
    for key in stage_config["requires"]:
        if request.state.get(key) is None:
            raise ValueError(f"到达 {current_step} 前必须先设置 {key}")

    # 使用状态值格式化 prompt（支持 {warranty_status}、{issue_type} 等）
    system_prompt = stage_config["prompt"].format(**request.state)

    # 注入 system prompt 和步骤专属工具
    request = request.override(
        system_prompt=system_prompt,
        tools=stage_config["tools"],
    )

    return handler(request)

此 middleware 会：

读取当前步骤：从 state 获取 current_step（默认值为 “warranty_collector”）。
查找配置：在 STEP_CONFIG 中找到匹配条目。
验证依赖项：确保必需的 state 字段存在。
格式化 prompt：将状态值注入 prompt 模板。
应用配置：覆盖 system prompt 和可用工具。

request.override() 方法是关键，它允许你根据状态动态更改 agent 行为，而无需创建单独的 agent 实例。

5. 创建 agent

现在，使用基于步骤的 middleware 和用于状态持久化的 checkpointer 创建 agent：

from langchain.agents import create_agent
from langgraph.checkpoint.memory import InMemorySaver

# 收集所有步骤配置中的全部工具
all_tools = [
    record_warranty_status,
    record_issue_type,
    provide_solution,
    escalate_to_human,
]

# 使用基于步骤的配置创建 agent
agent = create_agent(
    model,
    tools=all_tools,
    state_schema=SupportState,
    middleware=[apply_step_config],
    checkpointer=InMemorySaver(),
)

为什么需要 checkpointer？ checkpointer 会跨对话轮次维护状态。没有它，current_step 状态会在用户消息之间丢失，从而破坏工作流。

6. 测试工作流

测试完整工作流：

from langchain.messages import HumanMessage
from langchain_core.utils.uuid import uuid7

# 此对话 thread 的配置
thread_id = str(uuid7())
config = {"configurable": {"thread_id": thread_id}}

# 第 1 轮：初始消息，从 warranty_collector 步骤开始
print("=== 第 1 轮：收集保修信息 ===")
result = agent.invoke(
    {"messages": [HumanMessage("你好，我的手机屏幕碎了")]},
    config
)
for msg in result['messages']:
    msg.pretty_print()

# 第 2 轮：用户回答保修信息
print("\n=== 第 2 轮：保修回答 ===")
result = agent.invoke(
    {"messages": [HumanMessage("是的，它还在保修期内")]},
    config
)
for msg in result['messages']:
    msg.pretty_print()
print(f"当前步骤：{result.get('current_step')}")

# 第 3 轮：用户描述问题
print("\n=== 第 3 轮：问题描述 ===")
result = agent.invoke(
    {"messages": [HumanMessage("屏幕摔落后出现了物理裂纹")]},
    config
)
for msg in result['messages']:
    msg.pretty_print()
print(f"当前步骤：{result.get('current_step')}")

# 第 4 轮：解决方案
print("\n=== 第 4 轮：解决方案 ===")
result = agent.invoke(
    {"messages": [HumanMessage("我应该怎么办？")]},
    config
)
for msg in result['messages']:
    msg.pretty_print()

预期流程：

保修验证步骤：询问保修状态
问题分类步骤：询问问题并判断为硬件问题
解决方案步骤：提供保修维修说明

7. 理解状态转换

下面跟踪每一轮发生的事情：

第 1 轮：初始消息

{
    "messages": [HumanMessage("你好，我的手机屏幕碎了")],
    "current_step": "warranty_collector"  # 默认值
}

Middleware 会应用：

系统 prompt：WARRANTY_COLLECTOR_PROMPT
工具：[record_warranty_status]

第 2 轮：记录保修信息后

工具调用：record_warranty_status("in_warranty") 返回：

Command(update={
    "warranty_status": "in_warranty",
    "current_step": "issue_classifier"  # 状态转换！
})

下一轮，middleware 会应用：

系统 prompt：ISSUE_CLASSIFIER_PROMPT（使用 warranty_status="in_warranty" 格式化）
工具：[record_issue_type]

第 3 轮：问题分类后

工具调用：record_issue_type("hardware") 返回：

Command(update={
    "issue_type": "hardware",
    "current_step": "resolution_specialist"  # 状态转换！
})

下一轮，middleware 会应用：

系统 prompt：RESOLUTION_SPECIALIST_PROMPT（使用 warranty_status 和 issue_type 格式化）
工具：[provide_solution, escalate_to_human]

关键洞察是：工具通过更新 current_step 驱动工作流，而 middleware 会响应这一变化，在下一轮应用合适的配置。

8. 管理消息历史

随着 agent 推进各个步骤，消息历史会增长。使用 summarization middleware 压缩较早消息，同时保留对话上下文：

from langchain.agents import create_agent
from langchain.agents.middleware import SummarizationMiddleware  
from langgraph.checkpoint.memory import InMemorySaver

agent = create_agent(
    model,
    tools=all_tools,
    state_schema=SupportState,
    middleware=[
        apply_step_config,
        SummarizationMiddleware(
            model="gpt-5.4-mini",
            trigger=("tokens", 4000),
            keep=("messages", 10)
        )
    ],
    checkpointer=InMemorySaver(),
)

如需其他记忆管理技术，请参阅短期记忆指南。

9. 增加灵活性：返回上一步

有些工作流需要允许用户返回先前步骤来更正信息（例如更改保修状态或问题分类）。但是，并非所有转换都有意义，例如退款处理完成后通常不能回退。在这个客服工作流中，你将添加工具，用于返回保修验证步骤和问题分类步骤。

如果你的工作流要求在大多数步骤之间任意转换，请考虑是否真的需要结构化工作流。这个模式最适合步骤按清晰顺序推进，并偶尔通过向后转换来修正信息的场景。

向解决方案步骤添加“返回”工具：

@tool
def go_back_to_warranty() -> Command:
    """返回保修验证步骤。"""
    return Command(update={"current_step": "warranty_collector"})


@tool
def go_back_to_classification() -> Command:
    """返回问题分类步骤。"""
    return Command(update={"current_step": "issue_classifier"})


# 更新 resolution_specialist 配置，以包含这些工具
STEP_CONFIG["resolution_specialist"]["tools"].extend([
    go_back_to_warranty,
    go_back_to_classification
])

更新解决方案专家的 prompt，以提及这些工具：

RESOLUTION_SPECIALIST_PROMPT = """你是帮助客户处理设备问题的客服 agent。

当前阶段：解决方案
客户信息：保修状态为 {warranty_status}，问题类型为 {issue_type}

在此步骤中，你需要：
1. 对于软件问题：使用 provide_solution 提供故障排查步骤
2. 对于硬件问题：
   - 如果在保修期内：使用 provide_solution 说明保修维修流程
   - 如果超出保修期：使用 escalate_to_human 处理付费维修选项

如果客户表示任何信息有误，请使用：
- go_back_to_warranty 来更正保修状态
- go_back_to_classification 来更正问题类型

解决方案要具体且有帮助。"""

现在，agent 可以处理更正：

result = agent.invoke(
    {"messages": [HumanMessage("实际上我搞错了，我的设备已经过保了")]},
    config
)
# Agent 会调用 go_back_to_warranty 并重新启动保修验证步骤

完整示例

下面是整合后的可运行脚本：

Show 完整代码

"""
客服状态机示例

此示例演示状态机模式。
单个 agent 会根据 current_step 状态动态更改其行为，
从而创建一个用于顺序收集信息的状态机。
"""

from langchain_core.utils.uuid import uuid7

from langgraph.checkpoint.memory import InMemorySaver
from langgraph.types import Command
from typing import Callable, Literal
from typing_extensions import NotRequired

from langchain.agents import AgentState, create_agent
from langchain.agents.middleware import wrap_model_call, ModelRequest, ModelResponse, SummarizationMiddleware
from langchain.chat_models import init_chat_model
from langchain.messages import HumanMessage, ToolMessage
from langchain.tools import tool, ToolRuntime

model = init_chat_model("google_genai:gemini-3.5-flash")


# 定义可能的工作流步骤
SupportStep = Literal["warranty_collector", "issue_classifier", "resolution_specialist"]


class SupportState(AgentState):
    """客服工作流的状态。"""

    current_step: NotRequired[SupportStep]
    warranty_status: NotRequired[Literal["in_warranty", "out_of_warranty"]]
    issue_type: NotRequired[Literal["hardware", "software"]]


@tool
def record_warranty_status(
    status: Literal["in_warranty", "out_of_warranty"],
    runtime: ToolRuntime[None, SupportState],
) -> Command:
    """记录客户的保修状态，并转换到问题分类步骤。"""
    return Command(
        update={
            "messages": [
                ToolMessage(
                    content=f"保修状态已记录为：{status}",
                    tool_call_id=runtime.tool_call_id,
                )
            ],
            "warranty_status": status,
            "current_step": "issue_classifier",
        }
    )


@tool
def record_issue_type(
    issue_type: Literal["hardware", "software"],
    runtime: ToolRuntime[None, SupportState],
) -> Command:
    """记录问题类型，并转换到解决方案专家步骤。"""
    return Command(
        update={
            "messages": [
                ToolMessage(
                    content=f"问题类型已记录为：{issue_type}",
                    tool_call_id=runtime.tool_call_id,
                )
            ],
            "issue_type": issue_type,
            "current_step": "resolution_specialist",
        }
    )


@tool
def escalate_to_human(reason: str) -> str:
    """将工单升级给人工客服专家。"""
    # 在真实系统中，这会创建工单、通知员工等。
    return f"正在升级给人工客服。原因：{reason}"


@tool
def provide_solution(solution: str) -> str:
    """为客户问题提供解决方案。"""
    return f"已提供解决方案：{solution}"


# 将 prompt 定义为常量
WARRANTY_COLLECTOR_PROMPT = """你是帮助客户处理设备问题的客服 agent。

当前步骤：保修验证

在此步骤中，你需要：
1. 热情地问候客户
2. 询问客户的设备是否在保修期内
3. 使用 record_warranty_status 记录客户回答并进入下一步

保持自然、友好的对话风格。不要一次询问多个问题。"""

ISSUE_CLASSIFIER_PROMPT = """你是帮助客户处理设备问题的客服 agent。

当前步骤：问题分类
客户信息：保修状态为 {warranty_status}

在此步骤中，你需要：
1. 要求客户描述问题
2. 判断这是硬件问题（物理损坏、部件损坏）还是软件问题（app 崩溃、性能问题）
3. 使用 record_issue_type 记录分类并进入下一步

如果不清楚，请先提澄清问题，再进行分类。"""

RESOLUTION_SPECIALIST_PROMPT = """你是帮助客户处理设备问题的客服 agent。

当前步骤：解决方案
客户信息：保修状态为 {warranty_status}，问题类型为 {issue_type}

在此步骤中，你需要：
1. 对于软件问题：使用 provide_solution 提供故障排查步骤
2. 对于硬件问题：
   - 如果在保修期内：使用 provide_solution 说明保修维修流程
   - 如果超出保修期：使用 escalate_to_human 处理付费维修选项

解决方案要具体且有帮助。"""


# 步骤配置：将步骤名称映射到（prompt、tools、required_state）
STEP_CONFIG = {
    "warranty_collector": {
        "prompt": WARRANTY_COLLECTOR_PROMPT,
        "tools": [record_warranty_status],
        "requires": [],
    },
    "issue_classifier": {
        "prompt": ISSUE_CLASSIFIER_PROMPT,
        "tools": [record_issue_type],
        "requires": ["warranty_status"],
    },
    "resolution_specialist": {
        "prompt": RESOLUTION_SPECIALIST_PROMPT,
        "tools": [provide_solution, escalate_to_human],
        "requires": ["warranty_status", "issue_type"],
    },
}


@wrap_model_call
def apply_step_config(
    request: ModelRequest,
    handler: Callable[[ModelRequest], ModelResponse],
) -> ModelResponse:
    """根据当前步骤配置 agent 行为。"""
    # 获取当前步骤（首次交互默认使用 warranty_collector）
    current_step = request.state.get("current_step", "warranty_collector")

    # 查找步骤配置
    step_config = STEP_CONFIG[current_step]

    # 验证必需状态是否存在
    for key in step_config["requires"]:
        if request.state.get(key) is None:
            raise ValueError(f"到达 {current_step} 前必须先设置 {key}")

    # 使用状态值格式化 prompt
    system_prompt = step_config["prompt"].format(**request.state)

    # 注入 system prompt 和步骤专属工具
    request = request.override(
        system_prompt=system_prompt,
        tools=step_config["tools"],
    )

    return handler(request)


# 收集所有步骤配置中的全部工具
all_tools = [
    record_warranty_status,
    record_issue_type,
    provide_solution,
    escalate_to_human,
]

# 使用基于步骤的配置和摘要功能创建 agent
agent = create_agent(
    model,
    tools=all_tools,
    state_schema=SupportState,
    middleware=[
        apply_step_config,
        SummarizationMiddleware(
            model="gpt-5.4-mini",
            trigger=("tokens", 4000),
            keep=("messages", 10)
        )
    ],
    checkpointer=InMemorySaver(),
)


# ============================================================================
# 测试工作流
# ============================================================================

if __name__ == "__main__":
    thread_id = str(uuid7())
    config = {"configurable": {"thread_id": thread_id}}

    result = agent.invoke(
        {"messages": [HumanMessage("你好，我的手机屏幕碎了")]},
        config
    )

    result = agent.invoke(
        {"messages": [HumanMessage("是的，它还在保修期内")]},
        config
    )

    result = agent.invoke(
        {"messages": [HumanMessage("屏幕摔落后出现了物理裂纹")]},
        config
    )

    result = agent.invoke(
        {"messages": [HumanMessage("我应该怎么办？")]},
        config
    )
    for msg in result['messages']:
        msg.pretty_print()

后续步骤

学习用于集中式编排的 subagents 模式
探索 middleware，实现更动态的行为
阅读 multi-agent 概览，比较不同模式
使用 LangSmith 调试并监控你的 multi-agent 系统

Connect these docs to Claude, VSCode, and more via MCP for real-time answers.

Edit this page on GitHub or file an issue.

​设置

​安装

​LangSmith

​选择 LLM

​1. 定义自定义状态

​2. 创建管理工作流状态的工具

​3. 定义步骤配置

​4. 创建基于步骤的 middleware

​5. 创建 agent

​6. 测试工作流

​7. 理解状态转换

​第 1 轮：初始消息

​第 2 轮：记录保修信息后

​第 3 轮：问题分类后

​8. 管理消息历史

​9. 增加灵活性：返回上一步

​完整示例

​后续步骤

设置

安装

LangSmith

选择 LLM

1. 定义自定义状态

2. 创建管理工作流状态的工具

3. 定义步骤配置

4. 创建基于步骤的 middleware

5. 创建 agent

6. 测试工作流

7. 理解状态转换

第 1 轮：初始消息

第 2 轮：记录保修信息后

第 3 轮：问题分类后

8. 管理消息历史

9. 增加灵活性：返回上一步

完整示例

后续步骤