gemini-2.5-pro、gemini-2.5-flash 等。
它还提供一些非 Google 的模型,例如 Anthropic’s Claude。
本指南将帮助你快速上手 ChatVertexAI 聊天模型。有关所有 ChatVertexAI 功能和配置的详细文档,请查阅 API 参考。
此库将被弃用此库将被 ChatGoogle 库取代。
新的实现应改用 ChatGoogle 库,现有的实现也应考虑迁移。
概览
集成详情
| 类 | 包 | 可序列化 | Python 支持 | 下载量 | 版本 |
|---|---|---|---|---|---|
ChatVertexAI | @langchain/google-vertexai | ✅ | ✅ |
模型功能
请参阅下表标题中的链接,了解如何使用特定功能的指南。 请注意,虽然支持 logprobs,但 Gemini 对其使用有较为严格的限制。设置
LangChain.js 支持两种不同的身份验证方法,具体取决于你是在 Node.js 环境还是 Web 环境中运行。它还支持 Vertex AI Express 模式使用的身份验证方法,无论使用哪个包都可。 要访问ChatVertexAI 模型,你需要在 Google Cloud Platform (GCP) 账户中设置 Google VertexAI,保存凭据文件,并安装 @langchain/google-vertexai 集成包。在 Node.js 中,该包使用 @langchain/google-gauth 进行身份验证(无需单独安装)。
凭据
前往你的 GCP 账户 生成凭据文件。完成后,设置GOOGLE_APPLICATION_CREDENTIALS 环境变量:
gcloud auth application-default login 来使用应用默认凭据。
如果在 Web 环境中运行,请安装 @langchain/google-vertexai-web 包(该包使用 @langchain/google-webauth 进行身份验证)。在 GOOGLE_WEB_CREDENTIALS 中设置服务账号 JSON:
GOOGLE_VERTEX_AI_WEB_CREDENTIALS,但已弃用。
如果你使用的是 Vertex AI Express 模式,可以安装 @langchain/google-vertexai 或 @langchain/google-vertexai-web 包。
然后,前往 Express Mode API 密钥页面,在 GOOGLE_API_KEY 环境变量中设置你的 API 密钥:
安装
LangChain 的ChatVertexAI 集成位于 @langchain/google-vertexai 包中:
实例化
现在我们可以实例化模型对象并生成聊天补全:调用
使用 Google 搜索检索进行工具调用
可以调用带有 Google 搜索工具的模型,利用该工具将内容生成 [扎根] (https://cloud.google.com/vertex-ai/generative-ai/docs/model-reference/grounding) 于现实世界信息,减少幻觉。gemini-2.0-flash-exp 目前不支持扎根功能。
你可以选择使用 Google 搜索或自定义数据存储进行扎根。以下是两种方式的示例:
Google 搜索检索
使用 Google 搜索的扎根示例:使用数据存储的 Google 搜索检索
首先,设置你的数据存储(以下为示例数据存储的架构):| ID | 日期 | 队伍 1 | 比分 | 队伍 2 |
|---|---|---|---|---|
| 3001 | 2023-09-07 | Argentina | 1 - 0 | Ecuador |
| 3002 | 2023-09-12 | Venezuela | 1 - 0 | Paraguay |
| 3003 | 2023-09-12 | Chile | 0 - 0 | Colombia |
| 3004 | 2023-09-12 | Peru | 0 - 1 | Brazil |
| 3005 | 2024-10-15 | Argentina | 6 - 0 | Bolivia |
projectId 和 datastoreId)
上下文缓存
Vertex AI 提供上下文缓存功能,通过存储和重复使用跨多次 API 请求的长段消息内容来帮助优化成本。当你拥有较长的对话历史或频繁出现的消息段落时,此功能特别有用。 要使用此功能,请先按照 官方指南 创建上下文缓存。 创建缓存后,可以将其 ID 作为运行时参数传递,如下所示:API 参考
有关所有ChatVertexAI 功能和配置的详细文档,请查阅 API 参考。
Connect these docs to Claude, VSCode, and more via MCP for real-time answers.

