Gemini

Modellvarianten

Die Gemini API bietet verschiedene Modelle, die für bestimmte Anwendungsfälle optimiert sind Cases. Hier finden Sie einen kurzen Überblick über die verfügbaren Gemini-Varianten:

Modellvariante Eingabe(n) Ausgabe Optimiert für
Gemini 1.5 Pro
gemini-1.5-pro
Audio, Bilder, Videos und Text Text Komplexe Logikaufgaben wie Code- und Textgenerierung, Textbearbeitung, Problemlösung, Datenextraktion und -generierung
Gemini 1.5 Flash
gemini-1.5-flash
Audio, Bilder, Videos und Text Text Schnelle und vielseitige Leistung bei einer Vielzahl von Aufgaben
Gemini 1.0 Pro
gemini-1.0-pro
Text Text Aufgaben in natürlicher Sprache, mehrstufiger Text- und Codechat sowie Code Generation
(Verworfen) Gemini 1.0 Pro Vision
gemini-pro-vision
Bilder, Videos und Text Text Visuelle Aufgaben wie das Generieren von Bildern Beschreibungen oder die Identifizierung von Objekten in Bildern
Texteinbettung
text-embedding-004
Text Texteinbettungen Die Verbundenheit von Textzeichenfolgen messen
AQA
aqa
Text Text Quellengestützte Antworten auf Fragen geben

In der folgenden Tabelle werden die Attribute der Gemini-Modelle beschrieben, die: Modellvarianten gleich:

Attribut Beschreibung
Trainingsdaten Der Knowledge Grenzwert von Gemini findet im November 2023 statt. Das Wissen über Ereignisse nach diesem Zeitraum ist begrenzt.
Unterstützte Sprachen Verfügbare Sprachen
Konfigurierbare Modellparameter
  • Top P
  • Top k
  • Temperatur
  • Stoppsequenz
  • Maximale Ausgabelänge
  • Anzahl der Antwortkandidaten

Modellparameter ansehen Abschnitt des Leitfaden zu generativen Modellen finden Sie Informationen zu den einzelnen Parametern.

Gemini 1.5 Flash

Gemini 1.5 Flash ist ein schnelles und vielseitiges multimodales Modell für die Aufgaben zu organisieren.

In AI Studio testen

Modelldetails

Attribut Beschreibung
Modellcode models/gemini-1.5-flash
Unterstützte Datentypen

Eingaben

Audio, Bilder, Video und Text

Ausgabe

Text

Token limits[*]

Limit für Eingabetoken

1.048.576

Tokenausgabelimit

8.192

Audio/visuelle Spezifikationen

Maximale Anzahl von Bildern pro Prompt

3.600

Maximale Videolänge

1 Stunde

Maximale Audiolänge

Etwa 9,5 Stunden

Ratenbegrenzungen[**] <ph type="x-smartling-placeholder">
</ph> Kostenlos:
  • 15 RPM
  • 1 Million TPM
  • 1.500 RPD
<ph type="x-smartling-placeholder">
</ph> Pay-as-you-go:
  • 1.000 RPM
  • 2 Millionen TPM
Funktionen

Systemanweisungen

Unterstützt

JSON-Modus

Unterstützt

JSON-Schema

Nicht unterstützt

Anpassbare Sicherheitseinstellungen

Unterstützt

Caching

Unterstützt

Feinabstimmung

Nicht unterstützt

Funktionsaufrufe

Unterstützt

Konfiguration des Funktionsaufrufs

Unterstützt

Codeausführung

Unterstützt

Letzte Aktualisierung Mai 2024

Gemini 1.5 Pro,

Gemini 1.5 Pro ist ein mittelgroßes multimodales Modell, das für eine breite Palette von Aufgaben des Schlussfolgerungen zu lösen. 1.5 Pro kann große Datenmengen verarbeiten einschließlich 2 Stunden Video, 19 Stunden Audio, Codebasen mit 60.000 Codezeilen oder 2.000 Seiten Text.

In AI Studio testen

Modelldetails

Attribut Beschreibung
Modellcode models/gemini-1.5-pro
Unterstützte Datentypen

Eingaben

Audio, Bilder, Video und Text

Ausgabe

Text

Token limits[*]

Limit für Eingabetoken

2.097.152

Tokenausgabelimit

8.192

Audio/visuelle Spezifikationen

Maximale Anzahl von Bildern pro Prompt

7.200

Maximale Videolänge

2 Stunden

Maximale Audiolänge

Ca. 19 Stunden

Ratenbegrenzungen[**] <ph type="x-smartling-placeholder">
</ph> Kostenlos:
  • 2 U/min
  • 32.000 TPM
  • 50 RPD
<ph type="x-smartling-placeholder">
</ph> Pay-as-you-go:
  • 360 RPM
  • 2 Millionen TPM
  • 10.000 Anfragen pro Sekunde
Funktionen

Systemanweisungen

Unterstützt

JSON-Modus

Unterstützt

JSON-Schema

Unterstützt

Anpassbare Sicherheitseinstellungen

Unterstützt

Caching

Unterstützt

Feinabstimmung

Nicht unterstützt

Funktionsaufrufe

Unterstützt

Konfiguration des Funktionsaufrufs

Unterstützt

Codeausführung

Unterstützt

Letzte Aktualisierung Mai 2024

Gemini 1.0 Pro

Gemini 1.0 Pro ist ein NLP-Modell, das Aufgaben wie mehrsprachigen Text und und Codegenerierung.

In AI Studio testen

Modelldetails

Attribut Beschreibung
Modellcode models/gemini-1.0-pro
Unterstützte Datentypen

Eingabe

Text

Ausgabe

Text

Ratenbegrenzungen[**] <ph type="x-smartling-placeholder">
</ph> Kostenlos:
  • 15 RPM
  • 32.000 TPM
  • 1.500 RPD
<ph type="x-smartling-placeholder">
</ph> Pay-as-you-go:
  • 360 RPM
  • 120.000 TPM
  • 30.000 Anfragen pro Sekunde
Funktionen

Systemanweisungen

Nicht unterstützt

JSON-Modus

Nicht unterstützt

JSON-Schema

Nicht unterstützt

Anpassbare Sicherheitseinstellungen

Unterstützt

Caching

Nicht unterstützt

Feinabstimmung

Unterstützt

Funktionsaufrufe

Unterstützt

Konfiguration des Funktionsaufrufs

Nicht unterstützt

Codeausführung

Nicht unterstützt

Letzte Aktualisierung Februar 2024
<ph type="x-smartling-placeholder">

(Verworfen) Gemini 1.0 Pro Vision

Gemini 1.0 Pro Vision ist ein leistungsoptimiertes multimodales Modell die visuelle Aufgaben ausführen können. Mit 1.0 Pro Vision können Bildbeschreibungen generieren, Objekte in Bildern identifizieren, Informationen zu Orten oder Objekten auf Bildern und mehr

Modelldetails

Attribut Beschreibung
Modellcode models/gemini-pro-vision
Unterstützte Datentypen

Eingaben

Bilder, Videos und Text

Ausgabe

Text

Token limits[*]

Limit für Eingabetoken

12.288

Tokenausgabelimit

4.096

Audio/visuelle Spezifikationen

Maximale Videolänge

2 Minuten

Ratenbegrenzungen[**] 60 Anfragen pro Minute
Funktionen

Systemanweisungen

Nicht unterstützt

JSON-Modus

Nicht unterstützt

JSON-Schema

Nicht unterstützt

Anpassbare Sicherheitseinstellungen

Unterstützt

Caching

Nicht unterstützt

Feinabstimmung

Nicht unterstützt

Funktionsaufrufe

Unterstützt

Konfiguration des Funktionsaufrufs

Nicht unterstützt

Codeausführung

Nicht unterstützt

Letzte Aktualisierung Dezember 2023

Texteinbettungen

Texteinbettung

Mit dem Modell „Texteinbettung“ können Sie Texteinbettungen für Text ein. Weitere Informationen zum Texteinbettungsmodell finden Sie in der Dokumentation zu generativer KI in Vertex AI zu Texteinbettungen.

Das Texteinbettungsmodell ist für das Erstellen von Einbettungen mit 768 für Text von bis zu 2.048 Tokens. Die Texteinbettung bietet flexible Einbettungsgrößen unter 768. Mit elastischen Einbettungen können Sie kleineren Ausgabedimensionen und sparen unter Umständen Rechen- und Speicherkosten ein mit geringfügigen Leistungseinbußen.

Modelldetails
Attribut Beschreibung
Modellcode

Gemini API

models/text-embedding-004

Vertex AI

text-embedding-preview-0409

Unterstützte Datentypen

Eingabe

Text

Ausgabe

Texteinbettungen

Token limits[*]

Limit für Eingabetoken

2.048

Größe der Ausgabeabmessungen

768

Ratenbegrenzungen[**] 1.500 Anfragen pro Minute
Anpassbare Sicherheitseinstellungen Nicht unterstützt
Letzte Aktualisierung April 2024

Einbettung

<ph type="x-smartling-placeholder">

Mit dem Einbettungsmodell können Sie Texteinbettungen für Text ein.

Das Einbettungsmodell ist für das Erstellen von Einbettungen mit 768 Dimensionen optimiert für Text mit bis zu 2.048 Tokens.

Details zum Einbettungsmodell
Attribut Beschreibung
Modellcode models/embedding-001
Unterstützte Datentypen

Eingabe

Text

Ausgabe

Texteinbettungen

Token limits[*]

Limit für Eingabetoken

2.048

Größe der Ausgabeabmessungen

768

Ratenbegrenzungen[**] 1.500 Anfragen pro Minute
Anpassbare Sicherheitseinstellungen Nicht unterstützt
Letzte Aktualisierung Dezember 2023

AQA

Mit dem AQA-Modell können Sie Zugeordnete Fragenbeantwortung Aufgaben im Zusammenhang mit einem Dokument, Korpus oder einer Reihe von Passagen. Die AQA gibt das Modell Antworten auf Fragen zurück, die auf bereitgestellten Quellen basieren. sowie die Schätzung der beantwortbaren Wahrscheinlichkeit.

Modelldetails

Attribut Beschreibung
Modellcode models/aqa
Unterstützte Datentypen

Eingabe

Text

Ausgabe

Text

Unterstützte Sprache Englisch
Token limits[*]

Limit für Eingabetoken

7.168

Tokenausgabelimit

1.024

Ratenbegrenzungen[**] 1.500 Anfragen pro Minute
Anpassbare Sicherheitseinstellungen Unterstützt
Letzte Aktualisierung Dezember 2023

Beispiele zu den Funktionen dieses Modells verschiedene Varianten.

[*] Ein Token entspricht bei Gemini-Modellen etwa 4 Zeichen. 100 Tokens etwa 60 bis 80 englische Wörter.

[**] RPM: Anfragen pro Minute
TPM: Tokens pro Minute
RPD: Anfragen pro Tag
TPD: Tokens pro Tag

Aufgrund von Kapazitätsbeschränkungen sind angegebene maximale Ratenbegrenzungen nicht garantiert.

Muster für Modellversionsnamen

Gemini-Modelle sind entweder als Vorabversion oder als stabile Version verfügbar. In der Code eingeben, können Sie eines der folgenden Formate für Modellnamen verwenden, um anzugeben, welches Modell und die Version, die Sie verwenden möchten.

  • Neueste: Verweist auf die neueste Version des Modells für eine angegebene und Variation darstellen. Das zugrunde liegende Modell wird regelmäßig aktualisiert als Vorschauversion. Nur explorative Test-Apps und -Prototypen sollten verwenden Sie diesen Alias.

    Verwenden Sie das folgende Muster, um die neueste Version anzugeben: <model>-<generation>-<variation>-latest Beispiel: gemini-1.0-pro-latest

  • Neueste stabile Version:Verweist auf die neueste stabile Version, die für den Modellgenerierung und -variante festgelegt.

    Verwenden Sie das folgende Muster, um die neueste stabile Version anzugeben: <model>-<generation>-<variation> Beispiel: gemini-1.0-pro.

  • Stable (Stabil): Verweist auf ein bestimmtes stabiles Modell. Stabile Modelle ändern sich nicht. Die meisten Produktions-Apps sollten ein bestimmtes stabiles Modell verwenden.

    Verwenden Sie das folgende Muster, um eine stabile Version anzugeben: <model>-<generation>-<variation>-<version> Beispiel: gemini-1.0-pro-001

Verfügbare Sprachen

Gemini-Modelle sind darauf trainiert, mit den folgenden Sprachen zu arbeiten:

  • Arabisch (ar)
  • Bengalisch (bn)
  • Bulgarisch (bg)
  • Chinesisch, vereinfacht und traditionell (zh)
  • Kroatisch (hr)
  • Tschechisch (cs)
  • Dänisch (da)
  • Niederländisch (nl)
  • Englisch (en)
  • Estnisch (et)
  • Finnisch (fi)
  • Französisch (fr)
  • Deutsch (de)
  • Griechisch (el)
  • Hebräisch (iw)
  • Hindi (hi)
  • Ungarisch (hu)
  • Indonesisch (id)
  • Italienisch (it)
  • Japanisch (ja)
  • Koreanisch (ko)
  • Lettisch (lv)
  • Litauisch (lt)
  • Norwegisch (no)
  • Polnisch (pl)
  • Portugiesisch (pt)
  • Rumänisch (ro)
  • Russisch (ru)
  • Serbisch (sr)
  • Slowakisch (sk)
  • Slowenisch (sl)
  • Spanisch (es)
  • Swahili (sw)
  • Schwedisch (sv)
  • Thailändisch (th)
  • Türkisch (tr)
  • Ukrainisch (uk)
  • Vietnamesisch (vi)