Das Kontextfenster von Gemini 1.5 Pro 2M, Funktionen zur Codeausführung und Gemma 2 sind jetzt verfügbar. Weitere Informationen

Diese Seite wurde von der Cloud Translation API übersetzt.

Gemini

1.5 Flash

Unser schnellstes und kosteneffizientes multimodales Modell mit herausragender Leistung für häufige Aufgaben

Audio, Bilder, Video und Text eingeben und Textantworten erhalten
Code generieren, Daten extrahieren, Text bearbeiten und mehr
Am besten für eng gefasste, häufige Aufgaben geeignet

1.5 Pro

Unser leistungsstärkstes multimodales Modell mit Features für eine Vielzahl von Logikaufgaben

Audio, Bilder, Video und Text eingeben und Textantworten erhalten
Code generieren, Daten extrahieren, Text bearbeiten und mehr
Wenn Sie die Leistung steigern möchten

Modellvarianten

Die Gemini API bietet verschiedene Modelle, die für bestimmte Anwendungsfälle optimiert sind Cases. Hier finden Sie einen kurzen Überblick über die verfügbaren Gemini-Varianten:

Modellvariante	Eingabe(n)	Ausgabe	Optimiert für
Gemini 1.5 Pro `gemini-1.5-pro`	Audio, Bilder, Videos und Text	Text	Komplexe Logikaufgaben wie Code- und Textgenerierung, Textbearbeitung, Problemlösung, Datenextraktion und -generierung
Gemini 1.5 Flash `gemini-1.5-flash`	Audio, Bilder, Videos und Text	Text	Schnelle und vielseitige Leistung bei einer Vielzahl von Aufgaben
Gemini 1.0 Pro `gemini-1.0-pro`	Text	Text	Aufgaben in natürlicher Sprache, mehrstufiger Text- und Codechat sowie Code Generation
(Verworfen) Gemini 1.0 Pro Vision `gemini-pro-vision`	Bilder, Videos und Text	Text	Visuelle Aufgaben wie das Generieren von Bildern Beschreibungen oder die Identifizierung von Objekten in Bildern
Texteinbettung `text-embedding-004`	Text	Texteinbettungen	Die Verbundenheit von Textzeichenfolgen messen
AQA `aqa`	Text	Text	Quellengestützte Antworten auf Fragen geben

In der folgenden Tabelle werden die Attribute der Gemini-Modelle beschrieben, die: Modellvarianten gleich:

Attribut	Beschreibung
Trainingsdaten	Der Knowledge Grenzwert von Gemini findet im November 2023 statt. Das Wissen über Ereignisse nach diesem Zeitraum ist begrenzt.
Unterstützte Sprachen	Verfügbare Sprachen
Konfigurierbare Modellparameter	Top P Top k Temperatur Stoppsequenz Maximale Ausgabelänge Anzahl der Antwortkandidaten

Modellparameter ansehen Abschnitt des Leitfaden zu generativen Modellen finden Sie Informationen zu den einzelnen Parametern.

Gemini 1.5 Flash

Gemini 1.5 Flash ist ein schnelles und vielseitiges multimodales Modell für die Aufgaben zu organisieren.

In AI Studio testen

Modelldetails

Attribut	Beschreibung
Modellcode	`models/gemini-1.5-flash`
Unterstützte Datentypen	Eingaben Audio, Bilder, Video und Text Ausgabe Text
Token limits^[*]	Limit für Eingabetoken 1.048.576 Tokenausgabelimit 8.192
Audio/visuelle Spezifikationen	Maximale Anzahl von Bildern pro Prompt 3.600 Maximale Videolänge 1 Stunde Maximale Audiolänge Etwa 9,5 Stunden
Ratenbegrenzungen^[**]	<ph type="x-smartling-placeholder"> </ph> Kostenlos: 15 RPM 1 Million TPM 1.500 RPD <ph type="x-smartling-placeholder"> </ph> Pay-as-you-go: 1.000 RPM 2 Millionen TPM
Funktionen	Systemanweisungen Unterstützt JSON-Modus Unterstützt JSON-Schema Nicht unterstützt Anpassbare Sicherheitseinstellungen Unterstützt Caching Unterstützt Feinabstimmung Nicht unterstützt Funktionsaufrufe Unterstützt Konfiguration des Funktionsaufrufs Unterstützt Codeausführung Unterstützt
Letzte Aktualisierung	Mai 2024

Gemini 1.5 Pro,

Gemini 1.5 Pro ist ein mittelgroßes multimodales Modell, das für eine breite Palette von Aufgaben des Schlussfolgerungen zu lösen. 1.5 Pro kann große Datenmengen verarbeiten einschließlich 2 Stunden Video, 19 Stunden Audio, Codebasen mit 60.000 Codezeilen oder 2.000 Seiten Text.

In AI Studio testen

Modelldetails

Attribut	Beschreibung
Modellcode	`models/gemini-1.5-pro`
Unterstützte Datentypen	Eingaben Audio, Bilder, Video und Text Ausgabe Text
Token limits^[*]	Limit für Eingabetoken 2.097.152 Tokenausgabelimit 8.192
Audio/visuelle Spezifikationen	Maximale Anzahl von Bildern pro Prompt 7.200 Maximale Videolänge 2 Stunden Maximale Audiolänge Ca. 19 Stunden
Ratenbegrenzungen^[**]	<ph type="x-smartling-placeholder"> </ph> Kostenlos: 2 U/min 32.000 TPM 50 RPD <ph type="x-smartling-placeholder"> </ph> Pay-as-you-go: 360 RPM 2 Millionen TPM 10.000 Anfragen pro Sekunde
Funktionen	Systemanweisungen Unterstützt JSON-Modus Unterstützt JSON-Schema Unterstützt Anpassbare Sicherheitseinstellungen Unterstützt Caching Unterstützt Feinabstimmung Nicht unterstützt Funktionsaufrufe Unterstützt Konfiguration des Funktionsaufrufs Unterstützt Codeausführung Unterstützt
Letzte Aktualisierung	Mai 2024

Gemini 1.0 Pro

Gemini 1.0 Pro ist ein NLP-Modell, das Aufgaben wie mehrsprachigen Text und und Codegenerierung.

In AI Studio testen

Modelldetails

Attribut	Beschreibung
Modellcode	`models/gemini-1.0-pro`
Unterstützte Datentypen	Eingabe Text Ausgabe Text
Ratenbegrenzungen^[**]	<ph type="x-smartling-placeholder"> </ph> Kostenlos: 15 RPM 32.000 TPM 1.500 RPD <ph type="x-smartling-placeholder"> </ph> Pay-as-you-go: 360 RPM 120.000 TPM 30.000 Anfragen pro Sekunde
Funktionen	Systemanweisungen Nicht unterstützt JSON-Modus Nicht unterstützt JSON-Schema Nicht unterstützt Anpassbare Sicherheitseinstellungen Unterstützt Caching Nicht unterstützt Feinabstimmung Unterstützt Funktionsaufrufe Unterstützt Konfiguration des Funktionsaufrufs Nicht unterstützt Codeausführung Nicht unterstützt
Letzte Aktualisierung	Februar 2024

</ph> Hinweis: gemini-pro ist ein Alias für gemini-1.0-pro

(Verworfen) Gemini 1.0 Pro Vision

Gemini 1.0 Pro Vision ist ein leistungsoptimiertes multimodales Modell die visuelle Aufgaben ausführen können. Mit 1.0 Pro Vision können Bildbeschreibungen generieren, Objekte in Bildern identifizieren, Informationen zu Orten oder Objekten auf Bildern und mehr

Modelldetails

Attribut	Beschreibung
Modellcode	`models/gemini-pro-vision`
Unterstützte Datentypen	Eingaben Bilder, Videos und Text Ausgabe Text
Token limits^[*]	Limit für Eingabetoken 12.288 Tokenausgabelimit 4.096
Audio/visuelle Spezifikationen	Maximale Videolänge 2 Minuten
Ratenbegrenzungen^[**]	60 Anfragen pro Minute
Funktionen	Systemanweisungen Nicht unterstützt JSON-Modus Nicht unterstützt JSON-Schema Nicht unterstützt Anpassbare Sicherheitseinstellungen Unterstützt Caching Nicht unterstützt Feinabstimmung Nicht unterstützt Funktionsaufrufe Unterstützt Konfiguration des Funktionsaufrufs Nicht unterstützt Codeausführung Nicht unterstützt
Letzte Aktualisierung	Dezember 2023

Texteinbettungen

Texteinbettung

Mit dem Modell „Texteinbettung“ können Sie Texteinbettungen für Text ein. Weitere Informationen zum Texteinbettungsmodell finden Sie in der Dokumentation zu generativer KI in Vertex AI zu Texteinbettungen.

Das Texteinbettungsmodell ist für das Erstellen von Einbettungen mit 768 für Text von bis zu 2.048 Tokens. Die Texteinbettung bietet flexible Einbettungsgrößen unter 768. Mit elastischen Einbettungen können Sie kleineren Ausgabedimensionen und sparen unter Umständen Rechen- und Speicherkosten ein mit geringfügigen Leistungseinbußen.

Modelldetails

Attribut	Beschreibung
Modellcode	Gemini API `models/text-embedding-004` Vertex AI `text-embedding-preview-0409`
Unterstützte Datentypen	Eingabe Text Ausgabe Texteinbettungen
Token limits^[*]	Limit für Eingabetoken 2.048 Größe der Ausgabeabmessungen 768
Ratenbegrenzungen^[**]	1.500 Anfragen pro Minute
Anpassbare Sicherheitseinstellungen	Nicht unterstützt
Letzte Aktualisierung	April 2024

Einbettung

Mit dem Einbettungsmodell können Sie Texteinbettungen für Text ein.

Das Einbettungsmodell ist für das Erstellen von Einbettungen mit 768 Dimensionen optimiert für Text mit bis zu 2.048 Tokens.

Details zum Einbettungsmodell

Attribut	Beschreibung
Modellcode	`models/embedding-001`
Unterstützte Datentypen	Eingabe Text Ausgabe Texteinbettungen
Token limits^[*]	Limit für Eingabetoken 2.048 Größe der Ausgabeabmessungen 768
Ratenbegrenzungen^[**]	1.500 Anfragen pro Minute
Anpassbare Sicherheitseinstellungen	Nicht unterstützt
Letzte Aktualisierung	Dezember 2023

AQA

Mit dem AQA-Modell können Sie Zugeordnete Fragenbeantwortung Aufgaben im Zusammenhang mit einem Dokument, Korpus oder einer Reihe von Passagen. Die AQA gibt das Modell Antworten auf Fragen zurück, die auf bereitgestellten Quellen basieren. sowie die Schätzung der beantwortbaren Wahrscheinlichkeit.

Modelldetails

Attribut	Beschreibung
Modellcode	`models/aqa`
Unterstützte Datentypen	Eingabe Text Ausgabe Text
Unterstützte Sprache	Englisch
Token limits^[*]	Limit für Eingabetoken 7.168 Tokenausgabelimit 1.024
Ratenbegrenzungen^[**]	1.500 Anfragen pro Minute
Anpassbare Sicherheitseinstellungen	Unterstützt
Letzte Aktualisierung	Dezember 2023

Beispiele zu den Funktionen dieses Modells verschiedene Varianten.

[*] Ein Token entspricht bei Gemini-Modellen etwa 4 Zeichen. 100 Tokens etwa 60 bis 80 englische Wörter.

[**] RPM: Anfragen pro Minute
TPM: Tokens pro Minute
RPD: Anfragen pro Tag
TPD: Tokens pro Tag

Aufgrund von Kapazitätsbeschränkungen sind angegebene maximale Ratenbegrenzungen nicht garantiert.

Muster für Modellversionsnamen

Gemini-Modelle sind entweder als Vorabversion oder als stabile Version verfügbar. In der Code eingeben, können Sie eines der folgenden Formate für Modellnamen verwenden, um anzugeben, welches Modell und die Version, die Sie verwenden möchten.

Neueste: Verweist auf die neueste Version des Modells für eine angegebene und Variation darstellen. Das zugrunde liegende Modell wird regelmäßig aktualisiert als Vorschauversion. Nur explorative Test-Apps und -Prototypen sollten verwenden Sie diesen Alias.

Verwenden Sie das folgende Muster, um die neueste Version anzugeben: <model>-<generation>-<variation>-latest Beispiel: gemini-1.0-pro-latest
Neueste stabile Version:Verweist auf die neueste stabile Version, die für den Modellgenerierung und -variante festgelegt.

Verwenden Sie das folgende Muster, um die neueste stabile Version anzugeben: <model>-<generation>-<variation> Beispiel: gemini-1.0-pro.
Stable (Stabil): Verweist auf ein bestimmtes stabiles Modell. Stabile Modelle ändern sich nicht. Die meisten Produktions-Apps sollten ein bestimmtes stabiles Modell verwenden.

Verwenden Sie das folgende Muster, um eine stabile Version anzugeben: <model>-<generation>-<variation>-<version> Beispiel: gemini-1.0-pro-001

Verfügbare Sprachen

Gemini-Modelle sind darauf trainiert, mit den folgenden Sprachen zu arbeiten:

Arabisch (ar)
Bengalisch (bn)
Bulgarisch (bg)
Chinesisch, vereinfacht und traditionell (zh)
Kroatisch (hr)
Tschechisch (cs)
Dänisch (da)
Niederländisch (nl)
Englisch (en)
Estnisch (et)
Finnisch (fi)
Französisch (fr)
Deutsch (de)
Griechisch (el)
Hebräisch (iw)
Hindi (hi)
Ungarisch (hu)
Indonesisch (id)
Italienisch (it)
Japanisch (ja)
Koreanisch (ko)
Lettisch (lv)
Litauisch (lt)
Norwegisch (no)
Polnisch (pl)
Portugiesisch (pt)
Rumänisch (ro)
Russisch (ru)
Serbisch (sr)
Slowakisch (sk)
Slowenisch (sl)
Spanisch (es)
Swahili (sw)
Schwedisch (sv)
Thailändisch (th)
Türkisch (tr)
Ukrainisch (uk)
Vietnamesisch (vi)