Gemini 1.5 Pro 2M 上下文窗口、代码执行功能和 Gemma 2 现已推出。了解详情

此页面由 Cloud Translation API 翻译。

Gemini

1.5 Flash

我们运行速度最快、最具成本效益且性能卓越的多模态模型用于高频任务

输入音频、图片、视频和文本，获取文本回复
生成代码、提取数据、编辑文本等
最适合狭窄的高频率任务

1.5 专业版

我们表现最佳的多模态模型，具有可执行各种推理任务的特征

输入音频、图片、视频和文本，获取文本回复
生成代码、提取数据、编辑文本等
在需要提升性能时推荐

模型变体

Gemini API 提供了针对特定用途进行了优化的不同模型案例下面简要概述了可用的 Gemini 变体：

模型变体	输入	输出	优化目标
Gemini 1.5 Pro `gemini-1.5-pro`	音频、图片、视频和文字	文字	复杂的推理任务，如代码和文本生成，文本编辑、问题解决、数据提取和生成
Gemini 1.5 Flash `gemini-1.5-flash`	音频、图片、视频和文字	文字	以多种方��快速��理各种任务
Gemini 1.0 Pro `gemini-1.0-pro`	文字	文字	自然语言任务、多轮文本和代码聊天以及代码世代
（已弃用）Gemini 1.0 Pro Vision `gemini-pro-vision`	图片、视频和文字	文字	与视觉相关的任务，例如生成图片描述或识别图片中的对象
文本嵌入 `text-embedding-004`	文字	文本嵌入	衡量文本字符串的相关性
AQA `aqa`	文字	文字	提供以来源为依据的答案

下表介绍了 Gemini 模型的在所有模型变体中共有：

属性	说明
训练数据	Gemini 的知识截止时间是 2023 年 11 月。在此时间之后，有关活动的方面的信息会受到限制。
支持的语言	查看支持的语言
可配置的模型参数	顶部 p 前 k 名温度停止序列输出长度上限候选响应数量

有关详情，请参阅模型参数部分生成模型指南。

Gemini 1.5 Flash

Gemini 1.5 Flash 是一种快速、用途多样的多模态模型，可用于扩大各种任务。

在 AI Studio 中试用

模型详情

属性	说明
模型代码	`models/gemini-1.5-flash`
支持的数据类型	输入源音频、图片、视频和文字输出文字
令牌限制^[*]	输入词元限制 1,048,576,000 输出词元限制 8192
音频/视频规范	每个提示对应的图片数量上限 3,600 视频时长上限 1 小时音频时长上限大约 9.5 小时
速率限制^[**]	<ph type="x-smartling-placeholder"> </ph> 免费：每分钟 15 次 100 万 TPM 1500 RPD <ph type="x-smartling-placeholder"> </ph> Pay-as-you-go: 1,000 RPM 200 万 TPM
功能	系统指令支持 JSON 模式支持 JSON 架构不受支持可调整的安全设置支持缓存支持微调不受支持函数调用支持函数调用配置支持代码执行支持
最新动态	2024 年 5 月

Gemini 1.5 Pro

Gemini 1.5 Pro 是一个中型多模态模型，各种各样的推理任务。1.5 Pro 可以处理大量数据（包括 2 小时的视频、19 小时的音频、 6 万行代码或 2,000 页文字。

在 AI Studio 中试用

模型详情

属性	说明
模型代码	`models/gemini-1.5-pro`
支持的数据类型	输入源音频、图片、视频和文字输出文字
令牌限制^[*]	输入词元限制 2,097,152,000 输出词元限制 8192
音频/视频规范	每个提示对应的图片数量上限 7,200 视频时长上限 2 小时音频时长上限大约 19 小时
速率限制^[**]	<ph type="x-smartling-placeholder"> </ph> 免费：每分钟 2 次 32,000 TPM 50 RPD <ph type="x-smartling-placeholder"> </ph> Pay-as-you-go: 360 转/分钟 200 万 TPM 10,000 RPD
功能	系统指令支持 JSON 模式支持 JSON 架构支持可调整的安全设置支持缓存支持微调不受支持函数调用支持函数调用配置支持代码执行支持
最新动态	2024 年 5 月

Gemini 1.0 Pro

Gemini 1.0 Pro 是一个 NLP 模型，用于处理多轮文本和代码聊天和代码生成。

在 AI Studio 中试用

模型详情

属性	说明
模型代码	`models/gemini-1.0-pro`
支持的数据类型	输入文字输出文字
速率限制^[**]	<ph type="x-smartling-placeholder"> </ph> 免费：每分钟 15 次 32,000 TPM 1500 RPD <ph type="x-smartling-placeholder"> </ph> Pay-as-you-go: 360 转/分钟 120,000 TPM 30,000 RPD
功能	系统指令不受支持 JSON 模式不受支持 JSON 架构不受支持可调整的安全设置支持缓存不受支持微调支持函数调用支持函数调用配置不受支持代码执行不受支持
最新动态	2024 年 2 月

</ph> 注意：gemini-pro 是以下名称的别名： gemini-1.0-pro。

（已弃用）Gemini 1.0 Pro Vision

Gemini 1.0 Pro Vision 是一个性能优化型多模态模型执行视觉相关任务的应用。例如，1.0 Pro Vision 生成图片描述、识别图片中的对象、图片中呈现的地点或物体等信息。

模型详情

属性	说明
模型代码	`models/gemini-pro-vision`
支持的数据类型	输入源图片、视频和文字输出文字
令牌限制^[*]	输入词元限制 12288 输出词元限制 4096
音频/视频规范	视频时长上限 2 分钟
速率限制^[**]	每分钟 60 个请��
功能	系统指令不受支持 JSON 模式不受支持 JSON 架构不受支持可调整的安全设置支持缓存不受支持微调不受支持函数调用支持函数调用配置不受支持代码执行不受支持
最新动态	2023 年 12 月

文本嵌入和嵌入

文本嵌入

您可以使用文本嵌入模型文本嵌入：输入文本。有关文本嵌入模型的详细信息，请访问 Vertex AI 上的生成式 AI 文档文本嵌入。

文本嵌入模型针对创建嵌入进行了优化，采用 768 最多支持 2,048 个词元的文本。文本嵌入可提供弹性嵌入大小低于 768。你可以使用弹性嵌入更小的输出维度，并且有可能节省计算和存储费用轻微性能损失

模型详情

属性	说明
模型代码	Gemini API `models/text-embedding-004` Vertex AI `text-embedding-preview-0409`
支持的数据类型	输入文字输出文本嵌入
令牌限制^[*]	输入词元限制 2048 输出维度大小 768
速率限制^[**]	每分钟 1500 个请求
可调整的安全设置	不受支持
最新动态	2024 年 4 月

嵌入

您可以使用嵌入模型文本嵌入：输入文本。

嵌入模型针对创建具有 768 个维度的嵌入进行了优化最多支持 2,048 个词元的文本。

嵌入模型详细信息

属性	说明
模型代码	`models/embedding-001`
支持的数据类型	输入文字输出文本嵌入
令牌限制^[*]	输入词元限制 2048 输出维度大小 768
速率限制^[**]	每分钟 1500 个请求
可调整的安全设置	不受支持
最新动态	2023 年 12 月

空气质量认证 (AQA)

您可以使用 AQA 模型归因问答针对某个文档、语料库或一组段落执行的相关任务。AQA 模型会根据所提供的来源为问题返回答案，以及估计可回答概率。

模型详情

属性	说明
模型代码	`models/aqa`
支持的数据类型	输入文字输出文字
支持的语言	英语
令牌限制^[*]	输入词元限制 7168 输出词元限制 1024
速率限制^[**]	每分钟 1500 个请求
可调整的安全设置	支持
最新动态	2023 年 12 月

如需了解这些模型的功能，请查看示例变体。

[*] 对于 Gemini 模型，一个词元大约相当于 4 个字符。100 个词元大约有 60-80 个英语单词。

[**] RPM：每分钟请求数
TPM：每分钟令牌数
RPD：每日请求数
TPD：每日令牌数

��于容量限制，未指定的最大速率限制。

模型版本名称模式

Gemini 模型提供预览版或稳定版本。在代码，您可以使用以下模型名称格式之一来指定和版本。

最新：指向特定参数生成和变体。底层模型会定期更新，并且可能为预览版。只有探索性测试应用和原型才应使用此别名。

如需指定最新版本，请使用以下模式： <model>-<generation>-<variation>-latest.例如 gemini-1.0-pro-latest。
最新稳定版：指向模型生成和变体。

如需指定最新的稳定版本，请使用以下模式： <model>-<generation>-<variation>.例如 gemini-1.0-pro。
稳定：指向特定的稳定模型。稳定的模型不会发生变化。大多数正式版应用都应使用特定的稳定模型。

如需指定稳定版，请使用以下模式： <model>-<generation>-<variation>-<version>.例如 gemini-1.0-pro-001。

支持的语言

Gemini 模型经过训练，支持以下语言：

阿拉伯语 (ar)
孟加拉语 (bn)
保加利亚语 (bg)
简体中文和繁体中文 (zh)
克罗地亚语 (hr)
捷克语 (cs)
丹麦语 (da)
荷兰语 (nl)
英语 (en)
爱沙尼亚语 (et)
芬兰语 (fi)
法语 (fr)
德语 (de)
希腊语 (el)
希伯来语 (iw)
印地语 (hi)
匈牙利语 (hu)
印度尼西亚语 (id)
意大利语 (it)
日语 (ja)
韩语 (ko)
拉脱维亚语 (lv)
立陶宛语 (lt)
挪威语 (no)
波兰语 (pl)
葡萄牙语 (pt)
罗马尼亚语 (ro)
俄语 (ru)
塞尔维亚语 (sr)
斯洛伐克语 (sk)
斯洛维尼亚语 (sl)
西班牙语 (es)
斯瓦希里语 (sw)
瑞典语 (sv)
泰语 (th)
土耳其语 (tr)
乌克兰语 (uk)
越南语 (vi)