Prova i modelli Gemini 1.5, gli ultimi modelli multimodali di Vertex AI, e scopri cosa puoi creare con una finestra contestuale fino a 2 milioni di token. Prova i modelli Gemini 1.5, i più recenti modelli multimodali di Vertex AI, e scopri cosa puoi creare con una finestra contestuale fino a 2 milioni di token.

Questa pagina è stata tradotta dall'API Cloud Translation.

Ottieni previsioni da un modello addestrato personalizzato

Una previsione è l'output di un modello addestrato di machine learning. Questa pagina offre una panoramica del flusso di lavoro per ottenere previsioni dai modelli su Vertex AI.

Vertex AI offre due metodi per ottenere previsioni:

Le previsioni online sono richieste sincrone effettuate a un modello di cui è stato eseguito il deployment endpoint. Pertanto, prima di inviare devi prima eseguire il deployment Model per un endpoint. Questo associa il computing risorse con il modello, in modo che possa fornire previsioni online con bassa latenza. Usa online quando si effettuano richieste in risposta all'input dell'applicazione in situazioni che richiedono un'inferenza tempestiva.
Batch Le previsioni sono richieste asincrone effettuate a un modello che non è il deployment in un endpoint. Invii la richiesta (come BatchPredictionsJob risorsa) direttamente alla risorsa Model. Usa batch le previsioni quando non hai bisogno di una risposta immediata e vuoi elaborare dati accumulati attraverso una singola richiesta.

Testa il modello in locale

Prima di ottenere previsioni, è utile eseguire il deployment del modello durante la fase di sviluppo e test. In questo modo puoi eseguire l'iterazione in modo più rapido e testare il modello senza eseguirne il deployment in un endpoint online prevede costi di previsione. Il deployment locale è destinato allo sviluppo locale e test, non per i deployment di produzione.

Per eseguire il deployment di un modello in locale, utilizza l'SDK Vertex AI per Python ed esegui il deployment LocalModel a un LocalEndpoint. Per una dimostrazione, vedi questo un blocco note personalizzato.

Anche se il tuo client non è scritto in Python, puoi comunque utilizzare SDK Vertex AI per Python per avviare il container e il server in modo da poter testare richieste del tuo client.

Ricevi previsioni da modelli addestrati personalizzati

Per ottenere previsioni, devi prima importare il tuo modello. Dopo l'importazione, diventa un Model risorsa visibile in Vertex AI Model Registry.

Quindi, leggi la seguente documentazione per scoprire come ottenere previsioni:

Passaggi successivi

Scopri di più sulle risorse di computing per per la previsione.