Cloud TPU-Kontingente

In diesem Dokument sind die Kontingente für Cloud TPU aufgeführt. Informationen zu den Preisen für Cloud TPU finden Sie unter Cloud TPU-Preise.

Ein Kontingent schränkt ein, wie viel von einer bestimmten gemeinsam genutzten Google Cloud-Ressource Ihr Google Cloud-Projekt nutzen kann, einschließlich Hardware, Software und Netzwerkkomponenten. Daher sind Kontingente Teil eines Systems, das Folgendes tut:

  • Ihre Nutzung oder Ihren Verbrauch von Google Cloud-Produkten und -Diensten überwachen.
  • Ihren Verbrauch dieser Ressourcen einschränken, um u. a. für Fairness zu sorgen und Nutzungsspitzen zu reduzieren.
  • Konfigurationen verwalten, die automatisch vorgeschriebene Einschränkungen erzwingen.
  • Möglichkeit, das Kontingent anzufordern oder zu ändern.

Wenn ein Kontingentlimit überschritten wird, blockiert das System in den meisten Fällen den Zugriff auf die entsprechende Google-Ressource und die Aufgabe, die Sie ausführen möchten, schlägt fehl. In den meisten Fällen gelten Kontingente für jedes Google Cloud-Projekt und werden von allen Anwendungen und IP-Adressen geteilt, die dieses Google Cloud-Projekt verwenden.

TPU-Kontingent

Für jede TPU-Version gibt es unterschiedliche Kontingente. Für TPU v2, v3 usw. gelten beispielsweise unterschiedliche Kontingente. Für jede TPU-Version gibt es verschiedene Arten von Kontingenten: On-Demand und auf Abruf (Spot). In der folgenden Tabelle werden die verschiedenen Kontingentarten beschrieben.

Kontingenttyp Beschreibung Standardwert Anfrage senden Flags für die TPU-Erstellung
On demand Die Anzahl der On-Demand-Ressourcen, auf die Sie Zugriff haben. On-Demand-Ressourcen werden nicht vorzeitig beendet, aber ein On-Demand-Kontingent garantiert nicht, dass genügend Cloud TPU-Ressourcen verfügbar sind, um Ihre Anfrage zu erfüllen. v3-8 und v2-8: 16 TensorCores
Alle anderen: 0
Weitere Informationen finden Sie unter Weitere Kontingente anfordern. Keine Flags erforderlich, standardmäßig ausgewählt.
Auf Abruf Die Anzahl der Cloud TPU-Ressourcen auf Abruf, auf die Sie Zugriff haben. Dieses Kontingent gilt sowohl für TPUs auf Abruf als auch für TPU-Spot-VMs. Ressourcen auf Abruf können vorzeitig beendet werden, um Platz für Jobs mit höherer Priorität zu schaffen. Ein Kontingent auf Abruf garantiert nicht, dass genügend Cloud TPU-Ressourcen verfügbar sind, um Ihrer Anfrage nachzukommen. Weitere Informationen finden Sie unter TPUs auf Abruf und TPU-Spot-VMs verwalten. v3-8 und v2-8: 48 TensorCores
Alle anderen: 0
Weitere Informationen finden Sie unter Weitere Kontingente anfordern.

TPU-Kontingente werden in Form von TPU-Kernen pro Projekt und Zone oder als TPU-Kerne pro Projekt und Region angegeben.

TPU v5p-Kontingente

Sie können Ihr TPU-v5p-Kontingent in einer beliebigen Kombination von Kernen verwenden. Wenn Sie beispielsweise ein Kontingent für 32 Kerne haben, können Sie mit diesem Kontingent vier TPU-Segmente mit jeweils 8 Kernen erstellen.

Kontingente auf Abruf:

  • TPU v5p-Kerne auf Abruf pro Projekt und Region
  • TPU v5p-Kerne auf Abruf pro Projekt und Zone

On-Demand-Kontingente:

  • TPU v5p-Kerne pro Projekt und Region
  • TPU v5p-Kerne pro Projekt und Zone

TPU v5e-Kontingente

TPU v5e kann für Training und Bereitstellung verwendet werden. Es gibt separate Kontingente für Training und Bereitstellung sowie für einzelne Hosts (Lite-Kerne) und Multi-Hosts (Lite-Pod-Kerne).

Bereitstellungskontingente

Kontingente für die Bereitstellung auf Abruf:

  • TPU v5 Lite-Pod-Kerne auf Abruf für die Bereitstellung pro Projekt und Region
  • TPU v5 Lite-Pod-Kerne auf Abruf für die Bereitstellung pro Projekt und Zone

Kontingente für die On-Demand-Bereitstellung:

  • TPU v5 Lite-Pod-Kerne für die Bereitstellung pro Projekt und Region
  • TPU v5 Lite-Pod-Kerne für die Bereitstellung pro Projekt und Zone

Trainingskontingente

Kontingente für Training auf Abruf:

  • TPU v5 Lite-Kerne auf Abruf pro Projekt und Region
  • TPU v5 Lite-Kerne auf Abruf pro Projekt und Zone
  • TPU v5 Lite-Pod-Kerne auf Abruf pro Projekt und Region
  • TPU v5 Lite-Pod-Kerne auf Abruf pro Projekt und Zone

On-Demand-Trainingskontingente:

  • TPU v5 Lite-Kerne pro Projekt und Region
  • TPU v5 Lite-Kerne pro Projekt und Zone
  • TPU v5 Lite-Pod-Kerne pro Projekt und Region
  • TPU v5 Lite-Pod-Kerne pro Projekt und Zone

TPU v4-Kontingente

Sie können Ihr TPU v4-Kontingent in einer beliebigen Kombination von Kernen verwenden. Wenn Sie beispielsweise ein Kontingent für 32 Kerne haben, können Sie mit diesem Kontingent vier TPU-Segmente mit jeweils 8 Kernen erstellen.

Kontingente auf Abruf:

  • TPU v4-Pod-Kerne auf Abruf pro Projekt und Region
  • TPU v4-Pod-Kerne auf Abruf pro Projekt und Zone

On-Demand-Kontingente:

  • TPU v4-Pod-Kerne pro Projekt und Region
  • TPU v4-Pod-Kerne pro Projekt und Zone

TPU v3-Kontingente

Für TPU v3-Kontingente gelten für Einzelhost-TPUs (Kern) und Multihost-TPUs (Pods). Sie müssen v3-Pod-Kontingente verwenden, um TPUs mit mehr als 8 Kernen zu erstellen.

Kontingente auf Abruf:

  • TPU v3-Kerne auf Abruf pro Projekt und Region
  • TPU v3-Kerne auf Abruf pro Projekt und Zone
  • TPU v3-Pod-Kerne auf Abruf pro Projekt und Region
  • TPU v3-Pod-Kerne auf Abruf pro Projekt und Zone

On-Demand-Kontingente:

  • TPU v3-Kerne pro Projekt und Region
  • TPU v3-Kerne pro Projekt und Zone
  • TPU v3-Pod-Kerne pro Projekt und Region
  • TPU v3-Pod-Kerne pro Projekt und Zone

TPU v2-Kontingente

Es gibt separate TPU v2-Kontingente für TPUs mit einzelnem Host (Kern) und TPUs mit mehreren Hosts (Pods).

Kontingente auf Abruf:

  • TPU v2-Kerne auf Abruf pro Projekt und Region
  • TPU v2-Kerne auf Abruf pro Projekt und Zone
  • TPU v2-Pod-Kerne auf Abruf pro Projekt und Region
  • TPU v2-Pod-Kerne auf Abruf pro Projekt und Zone

On-Demand-Kontingente:

  • TPU v2-Kerne pro Projekt und Region
  • TPU v2-Kerne pro Projekt und Zone
  • TPU v2-Pod-Kerne pro Projekt und Region
  • TPU v2-Pod-Kerne pro Projekt und Zone

Weitere Informationen zu TPU-Chips und TensorCores finden Sie unter TPU-Systemarchitektur.

Kontingent aufrufen und weitere Kontingente anfordern

Sie können das Ihrem Google Cloud-Projekt zugewiesene Kontingent in der Google Cloud Console auf der Seite „Kontingente“ ansehen. Wenn Sie ein zusätzliches Cloud TPU-Kontingent benötigen, können Sie es auf der Seite „Kontingente“ anfordern. Weitere Informationen finden Sie unter Höheres Kontingentlimit anfordern.