Human-in-the-Loop(HITL)middleware 让你可以为代理工具调用添加人工监督。 当模型提出可能需要审核的动作时,例如写入文件或执行 SQL,该 middleware 可以暂停执行并等待决策。 它通过根据可配置策略检查每个工具调用来实现这一点。如果需要介入,middleware 会发出 interrupt 以暂停执行。图状态会通过 LangGraph 的 persistence layer 保存,因此执行可以安全暂停并稍后恢复。 人工决策会决定接下来发生什么:动作可以按原样批准(approve)、在运行前修改(edit)、带反馈拒绝(reject),或针对 “ask user” 风格工具直接响应(respond)。

Interrupt 决策类型

middleware 定义了人工响应 interrupt 的四种内置方式:
决策类型描述示例用例
approve动作按原样批准并无修改执行。按原文发送电子邮件草稿
✏️ edit工具调用会带着修改执行。发送电子邮件前更改收件人
reject工具调用被拒绝,并向对话添加解释。拒绝删除文件并说明原因
💬 respond跳过工具执行,人工消息成为工具结果。用直接回复回答 “ask_user” prompt
每个工具可用的决策类型取决于你在 interrupt_on 中配置的策略。 当多个工具调用同时暂停时,每个动作都需要单独决策。 决策必须按照动作在 interrupt request 中出现的顺序提供。 当人工拒绝请求动作时使用 reject。只有当人工扮演工具角色时才使用 respond,例如回答 ask_user prompt。不要用 respond 拒绝有副作用的工具,因为其消息会被视为成功的工具结果。
编辑工具参数时,请保守修改。对原始参数的大幅修改可能导致模型重新评估其方法,并可能多次执行工具或采取意外动作。

配置 interrupts

要使用 HITL,请在创建代理时将该 middleware 添加到代理的 middleware 列表。 你通过将工具动作映射到每个动作允许的决策类型来配置它。当工具调用匹配映射中的动作时,middleware 会中断执行。
from langchain.agents import create_agent
from langchain.agents.middleware import HumanInTheLoopMiddleware 
from langgraph.checkpoint.memory import InMemorySaver 


agent = create_agent(
    model="gpt-5.4",
    tools=[write_file, execute_sql, read_data],
    middleware=[
        HumanInTheLoopMiddleware(
            interrupt_on={
                "write_file": True,  # All decisions (approve, edit, reject, respond) allowed
                "execute_sql": {"allowed_decisions": ["approve", "reject"]},  # No editing allowed
                "read_data": False, # Safe operation, no approval needed
            },
            # Prefix for interrupt messages - combined with tool name and args to form the full message
            # e.g., "Tool execution pending approval: execute_sql with query='DELETE FROM...'"
            # Individual tools can override this by specifying a "description" in their interrupt config
            description_prefix="Tool execution pending approval",
        ),
    ],
    # Human-in-the-loop requires checkpointing to handle interrupts.
    # In production, use a persistent checkpointer like AsyncPostgresSaver.
    checkpointer=InMemorySaver(),
)
必须配置 checkpointer,以在 interrupts 之间持久化图状态。 在生产环境中,请使用 AsyncPostgresSaver 等持久 checkpointer。测试或原型阶段可使用 InMemorySaver调用代理时,传入包含 thread IDconfig,以将执行与对话线程关联。 详情请参阅 LangGraph interrupts documentation
interrupt_on
dict
required
工具名称到审批配置的映射。值可以是 True(使用默认配置中断)、False(自动批准)或 InterruptOnConfig 对象。
description_prefix
string
default:"Tool execution requires approval"
动作请求描述的前缀
InterruptOnConfig 选项:
allowed_decisions
list[string]
允许的决策列表:'approve''edit''reject''respond'
description
string | callable
用于自定义描述的静态字符串或 callable 函数
when
callable
可选 predicate,接收 ToolCallRequest,并返回 True 以中断或 False 以自动批准。可用它根据调用参数控制 interrupts。需要 langchain>=1.3.3

条件 interrupts

默认情况下,interrupt_on 中列出的每个工具调用都会暂停等待审核。要只暂停部分调用,请向工具的 InterruptOnConfig 添加 when predicate。该 predicate 接收 ToolCallRequest,并返回 True 以中断或 False 以自动批准,因此你可以根据工具参数进行控制。
条件 interrupts 需要 langchain>=1.3.3
from langchain.agents import create_agent
from langchain.agents.middleware import HumanInTheLoopMiddleware, ToolCallRequest
from langgraph.checkpoint.memory import InMemorySaver


def writes_outside_workspace(request: ToolCallRequest) -> bool:
    """Pause writes to paths outside the workspace directory."""
    path = request.tool_call["args"].get("path", "")
    return not path.startswith("/workspace/")


def is_write_query(request: ToolCallRequest) -> bool:
    """Pause SQL that isn't a read-only SELECT."""
    query = request.tool_call["args"].get("query", "")
    return not query.lstrip().upper().startswith("SELECT")


agent = create_agent(
    model="gpt-5.4",
    tools=[write_file, execute_sql, read_data],
    middleware=[
        HumanInTheLoopMiddleware(
            interrupt_on={
                "write_file": {
                    "allowed_decisions": ["approve", "edit", "reject"],
                    "when": writes_outside_workspace,
                },
                "execute_sql": {
                    "allowed_decisions": ["approve", "reject"],
                    "when": is_write_query,
                },
            },
        ),
    ],
    checkpointer=InMemorySaver(),
)
when predicate 返回 False 时,调用会在不中断的情况下运行。当它返回 True,或省略 when 时,调用会照常暂停。求值为 False 的调用永远不会加入 interrupt batch,因此审核者只会看到需要决策的动作。

响应 interrupts

调用代理时,它会一直运行,直到完成或触发 interrupt。当工具调用匹配你在 interrupt_on 中配置的策略时,就会触发 interrupt。使用 version="v2" 时,结果是一个带有 interrupts 属性的 GraphOutput,其中包含需要审核的动作。之后你可以将这些动作展示给审核者,并在提供决策后恢复执行。
from langgraph.types import Command

# Human-in-the-loop leverages LangGraph's persistence layer.
# You must provide a thread ID to associate the execution with a conversation thread,
# so the conversation can be paused and resumed (as is needed for human review).
config = {"configurable": {"thread_id": "some_id"}}
# Run the graph until the interrupt is hit.
result = agent.invoke(
    {
        "messages": [
            {
                "role": "user",
                "content": "Delete old records from the database",
            }
        ]
    },
    config=config,
    version="v2",
)

# result is a GraphOutput with .value and .interrupts
print(result.interrupts)
# > (
# >    Interrupt(
# >       value={
# >          'action_requests': [
# >             {
# >                'name': 'execute_sql',
# >                'arguments': {'query': 'DELETE FROM records WHERE created_at < NOW() - INTERVAL \'30 days\';'},
# >                'description': 'Tool execution pending approval\n\nTool: execute_sql\nArgs: {...}'
# >             }
# >          ],
# >          'review_configs': [
# >             {
# >                'action_name': 'execute_sql',
# >                'allowed_decisions': ['approve', 'reject']
# >             }
# >          ]
# >       }
# >    ),
# > )


# Resume with approval decision
agent.invoke(
    Command(
        resume={"decisions": [{"type": "approve"}]}  # or "reject"
    ),
    config=config, # Same thread ID to resume the paused conversation
    version="v2",
)

决策类型

使用 approve 按原样批准工具调用并无修改执行。
agent.invoke(
    Command(
        # Decisions are provided as a list, one per action under review.
        # The order of decisions must match the order of actions
        # in the interrupt request.
        resume={
            "decisions": [
                {
                    "type": "approve",
                }
            ]
        }
    ),
    config=config,  # Same thread ID to resume the paused conversation
    version="v2",
)

多个决策

当有多个动作正在审核时,请按它们在 interrupt 中出现的相同顺序为每个动作提供决策:
{
    "decisions": [
        {"type": "approve"},
        {
            "type": "edit",
            "edited_action": {
                "name": "tool_name",
                "args": {"param": "new_value"}
            }
        },
        {
            "type": "reject",
            "message": "This action is not allowed"
        }
    ]
}

结合 human-in-the-loop 流式传输

可以使用 stream() 代替 invoke(),在代理运行并处理 interrupts 时获取实时更新。将 stream_mode=['updates', 'messages']version="v2" 搭配使用,可用统一 v2 格式同时流式传输代理进度和 LLM tokens。
from langgraph.types import Command

config = {"configurable": {"thread_id": "some_id"}}

# Stream agent progress and LLM tokens until interrupt
for chunk in agent.stream(
    {"messages": [{"role": "user", "content": "Delete old records from the database"}]},
    config=config,
    stream_mode=["updates", "messages"],
    version="v2",
):
    if chunk["type"] == "messages":
        # LLM token
        token, metadata = chunk["data"]
        if token.content:
            print(token.content, end="", flush=True)
    elif chunk["type"] == "updates":
        # Check for interrupt
        if "__interrupt__" in chunk["data"]:
            print(f"\n\nInterrupt: {chunk['data']['__interrupt__']}")

# Resume with streaming after human decision
for chunk in agent.stream(
    Command(resume={"decisions": [{"type": "approve"}]}),
    config=config,
    stream_mode=["updates", "messages"],
    version="v2",
):
    if chunk["type"] == "messages":
        token, metadata = chunk["data"]
        if token.content:
            print(token.content, end="", flush=True)
Stream modes 的更多详情请参阅 Streaming 指南。

执行生命周期

该 middleware 定义了一个 after_model hook,它在模型生成响应之后、任何工具调用执行之前运行:
  1. 代理调用模型生成响应。
  2. Middleware 检查响应中的工具调用。
  3. 如果任何调用需要人工输入,middleware 会构建包含 action_requestsreview_configsHITLRequest 并调用 interrupt
  4. 代理等待人工决策。
  5. 根据 HITLResponse 决策,middleware 会执行已批准或已编辑的调用,为已拒绝的调用合成 ToolMessage,将 respond 决策中的人工回复直接作为 ToolMessage 返回,并恢复执行。

自定义 HITL 逻辑

对于更专门的工作流,可以直接使用 interrupt 原语和 middleware 抽象构建自定义 HITL 逻辑。 请查看上方执行生命周期,了解如何将 interrupts 集成到代理操作中。