Gemini

模型变体

Gemini API 提供了针对特定用途进行了优化的不同模型 案例下面简要概述了可用的 Gemini 变体:

模型变体 输入 输出 优化目标
Gemini 1.5 Pro
gemini-1.5-pro
音频、图片、视频和文字 文字 复杂的推理任务,如代码和文本生成, 文本编辑、问题解决、数据提取和生成
Gemini 1.5 Flash
gemini-1.5-flash
音频、图片、视频和文字 文字 以多种方��快速���理各种任务
Gemini 1.0 Pro
gemini-1.0-pro
文字 文字 自然语言任务、多轮文本和代码聊天以及代码 世代
(已弃用)Gemini 1.0 Pro Vision
gemini-pro-vision
图片、视频和文字 文字 与视觉相关的任务,例如生成图片 描述或识别图片中的对象
文本嵌入
text-embedding-004
文字 文本嵌入 衡量文本字符串的相关性
AQA
aqa
文字 文字 提供以来源为依据的答案

下表介绍了 Gemini 模型的 在所有模型变体中共有:

属性 说明
训练数据 Gemini 的知识截止时间是 2023 年 11 月。 在此时间之后,有关活动的方面的信息会受到限制。
支持的语言 查看支持的语言
可配置的模型参数
  • 顶部 p
  • 前 k 名
  • 温度
  • 停止序列
  • 输出长度上限
  • 候选响应数量

有关详情,请参阅模型参数 部分 生成模型指南。

Gemini 1.5 Flash

Gemini 1.5 Flash 是一种快速、用途多样的多模态模型,可用于扩大 各种任务。

在 AI Studio 中试用

模型详情

属性 说明
模型代码 models/gemini-1.5-flash
支持的数据类型

输入源

音频、图片、视频和文字

输出

文字

令牌限制[*]

输入词元限制

1,048,576,000

输出词元限制

8192

音频/视频规范

每个提示对应的图片数量上限

3,600

视频时长上限

1 小时

音频时长上限

大约 9.5 小时

速率限制[**] <ph type="x-smartling-placeholder">
</ph> 免费
  • 每分钟 15 次
  • 100 万 TPM
  • 1500 RPD
<ph type="x-smartling-placeholder">
</ph> Pay-as-you-go:
  • 1,000 RPM
  • 200 万 TPM
功能

系统指令

支持

JSON 模式

支持

JSON 架构

不受支持

可调整的安全设置

支持

缓存

支持

微调

不受支持

函数调用

支持

函数调用配置

支持

代码执行

支持

最新动态 2024 年 5 月

Gemini 1.5 Pro

Gemini 1.5 Pro 是一个中型多模态模型, 各种各样的推理任务。1.5 Pro 可以处理大量数据 (包括 2 小时的视频、19 小时的音频、 6 万行代码或 2,000 页文字。

在 AI Studio 中试用

模型详情

属性 说明
模型代码 models/gemini-1.5-pro
支持的数据类型

输入源

音频、图片、视频和文字

输出

文字

令牌限制[*]

输入词元限制

2,097,152,000

输出词元限制

8192

音频/视频规范

每个提示对应的图片数量上限

7,200

视频时长上限

2 小时

音频时长上限

大约 19 小时

速率限制[**] <ph type="x-smartling-placeholder">
</ph> 免费
  • 每分钟 2 次
  • 32,000 TPM
  • 50 RPD
<ph type="x-smartling-placeholder">
</ph> Pay-as-you-go:
  • 360 转/分钟
  • 200 万 TPM
  • 10,000 RPD
功能

系统指令

支持

JSON 模式

支持

JSON 架构

支持

可调整的安全设置

支持

缓存

支持

微调

不受支持

函数调用

支持

函数调用配置

支持

代码执行

支持

最新动态 2024 年 5 月

Gemini 1.0 Pro

Gemini 1.0 Pro 是一个 NLP 模型,用于处理多轮文本和 代码聊天和代码生成。

在 AI Studio 中试用

模型详情

属性 说明
模型代码 models/gemini-1.0-pro
支持的数据类型

输入

文字

输出

文字

速率限制[**] <ph type="x-smartling-placeholder">
</ph> 免费
  • 每分钟 15 次
  • 32,000 TPM
  • 1500 RPD
<ph type="x-smartling-placeholder">
</ph> Pay-as-you-go:
  • 360 转/分钟
  • 120,000 TPM
  • 30,000 RPD
功能

系统指令

不受支持

JSON 模式

不受支持

JSON 架构

不受支持

可调整的安全设置

支持

缓存

不受支持

微调

支持

函数调用

支持

函数调用配置

不受支持

代码执行

不受支持

最新动态 2024 年 2 月
<ph type="x-smartling-placeholder">

(已弃用)Gemini 1.0 Pro Vision

Gemini 1.0 Pro Vision 是一个性能优化型多模态模型 执行视觉相关任务的应用。例如,1.0 Pro Vision 生成图片描述、识别图片中的对象、 图片中呈现的地点或物体等信息。

模型详情

属性 说明
模型代码 models/gemini-pro-vision
支持的数据类型

输入源

图片、视频和文字

输出

文字

令牌限制[*]

输入词元限制

12288

输出词元限制

4096

音频/视频规范

视频时长上限

2 分钟

速率限制[**] 每分钟 60 个请��
功能

系统指令

不受支持

JSON 模式

不受支持

JSON 架构

不受支持

可调整的安全设置

支持

缓存

不受支持

微调

不受支持

函数调用

支持

函数调用配置

不受支持

代码执行

不受支持

最新动态 2023 年 12 月

文本嵌入和嵌入

文本嵌入

您可以使用文本嵌入模型 文本嵌入: 输入文本。有关文本嵌入模型的详细信息,请访问 Vertex AI 上的生成式 AI 文档 文本嵌入。

文本嵌入模型针对创建嵌入进行了优化,采用 768 最多支持 2,048 个词元的文本。文本嵌入可提供弹性 嵌入大小低于 768。你可以使用弹性嵌入 更小的输出维度,并且有可能节省计算和存储费用 轻微性能损失

模型详情
属性 说明
模型代码

Gemini API

models/text-embedding-004

Vertex AI

text-embedding-preview-0409

支持的数据类型

输入

文字

输出

文本嵌入

令牌限制[*]

输入词元限制

2048

输出维度大小

768

速率限制[**] 每分钟 1500 个请求
可调整的安全设置 不受支持
最新动态 2024 年 4 月

嵌入

<ph type="x-smartling-placeholder">

您可以使用嵌入模型 文本嵌入: 输入文本。

嵌入模型针对创建具有 768 个维度的嵌入进行了优化 最多支持 2,048 个词元的文本。

嵌入模型详细信息
属性 说明
模型代码 models/embedding-001
支持的数据类型

输入

文字

输出

文本嵌入

令牌限制[*]

输入词元限制

2048

输出维度大小

768

速率限制[**] 每分钟 1500 个请求
可调整的安全设置 不受支持
最新动态 2023 年 12 月

空气质量认证 (AQA)

您可以使用 AQA 模型 归因问答 针对某个文档、语料库或一组段落执行的相关任务。AQA 模型会根据所提供的来源为问题返回答案, 以及估计可回答概率。

模型详情

属性 说明
模型代码 models/aqa
支持的数据类型

输入

文字

输出

文字

支持的语言 英语
令牌限制[*]

输入词元限制

7168

输出词元限制

1024

速率限制[**] 每分钟 1500 个请求
可调整的安全设置 支持
最新动态 2023 年 12 月

如需了解这些模型的功能,请查看示例 变体。

[*] 对于 Gemini 模型,一个词元大约相当于 4 个字符。100 个词元 大约有 60-80 个英语单词。

[**] RPM:每分钟请求数
TPM:每分钟令牌数
RPD:每日请求数
TPD:每日令牌数

���于容量限制,未指定的最大速率限制 。

模型版本名称模式

Gemini 模型提供预览版稳定版本。在 代码,您可以使用以下模型名称格式之一来指定 和版本。

  • 最新:指向特定参数 生成和变体。底层模型会定期更新,并且可能 为预览版。只有探索性测试应用和原型才应 使用此别名。

    如需指定最新版本,请使用以下模式: <model>-<generation>-<variation>-latest.例如 gemini-1.0-pro-latest

  • 最新稳定版:指向 模型生成和变体。

    如需指定最新的稳定版本,请使用以下模式: <model>-<generation>-<variation>.例如 gemini-1.0-pro

  • 稳定:指向特定的稳定模型。稳定的模型不会发生变化。 大多数正式版应用都应使用特定的稳定模型。

    如需指定稳定版,请使用以下模式: <model>-<generation>-<variation>-<version>.例如 gemini-1.0-pro-001

支持的语言

Gemini 模型经过训练,支持以下语言:

  • 阿拉伯语 (ar)
  • 孟加拉语 (bn)
  • 保加利亚语 (bg)
  • 简体中文和繁体中文 (zh)
  • 克罗地亚语 (hr)
  • 捷克语 (cs)
  • 丹麦语 (da)
  • 荷兰语 (nl)
  • 英语 (en)
  • 爱沙尼亚语 (et)
  • 芬兰语 (fi)
  • 法语 (fr)
  • 德语 (de)
  • 希腊语 (el)
  • 希伯来语 (iw)
  • 印地语 (hi)
  • 匈牙利语 (hu)
  • 印度尼西亚语 (id)
  • 意大利语 (it)
  • 日语 (ja)
  • 韩语 (ko)
  • 拉脱维亚语 (lv)
  • 立陶宛语 (lt)
  • 挪威语 (no)
  • 波兰语 (pl)
  • 葡萄牙语 (pt)
  • 罗马尼亚语 (ro)
  • 俄语 (ru)
  • 塞尔维亚语 (sr)
  • 斯洛伐克语 (sk)
  • 斯洛维尼亚语 (sl)
  • 西班牙语 (es)
  • 斯瓦希里语 (sw)
  • 瑞典语 (sv)
  • 泰语 (th)
  • 土耳其语 (tr)
  • 乌克兰语 (uk)
  • 越南语 (vi)