Anleitung zur Optimierung

In diesem Notebook erfahren Sie, wie Sie den Abstimmungsdienst der Gemini API mithilfe von CURL-Befehlen oder der Python Request API verwenden, um die Gemini API aufzurufen. Hier erfahren Sie, wie Sie das Textmodell hinter dem Textgenerierungsdienst der Gemini API abstimmen.

Authentifizierung einrichten

Mit der Gemini API können Sie Modelle anhand Ihrer eigenen Daten abstimmen. Da es sich um Ihre Daten und Ihre abgestimmten Modelle handelt, sind dafür strengere Zugriffskontrollen erforderlich, als API-Schlüssel bieten können.

Bevor Sie diese Anleitung ausführen können, müssen Sie OAuth für Ihr Projekt einrichten.

In Colab ist die Einrichtung am einfachsten, wenn Sie den Inhalt Ihrer client_secret.json-Datei in den „Secrets Manager“ von Colab (unter dem Schlüsselsymbol im linken Bereich) mit dem Secret-Namen CLIENT_SECRET kopieren.

Dieser gcloud-Befehl wandelt die Datei client_secret.json in Anmeldedaten um, die zur Authentifizierung beim Dienst verwendet werden können.

  from google.colab import userdata
  import pathlib

  # Use `--no-browser` in colab
  !gcloud auth application-default login --no-browser --client-id-file client_secret.json --scopes=','
except ImportError:
  !gcloud auth application-default login --client-id-file client_secret.json --scopes=','
You are authorizing client libraries without access to a web browser. Please run the following command on a machine with a web browser and copy its output back here. Make sure the installed gcloud version is 372.0.0 or newer.

gcloud auth application-default login --remote-bootstrap=""

Enter the output of the above command: https://localhost:8085/?state=QIyNibWSaTIsozjmvZEkVBo6EcoW0G&code=4/0AeaYSHBKrY911S466QjKQIFODoOPXlO1mWyTYYdrbELIDV6Hw2DKRAyro62BugroSvIWsA&scope=

Credentials saved to file: [/content/.config/application_default_credentials.json]

These credentials will be used by any library that requests Application Default Credentials (ADC).

Variablen festlegen


Legen Sie Variablen für wiederkehrende Werte fest, die für die restlichen REST API-Aufrufe verwendet werden sollen. Der Code verwendet die Python-Bibliothek os, um Umgebungsvariablen festzulegen, auf die in allen Codezellen zugegriffen werden kann.

Dies gilt speziell für die Colab-Notebookumgebung. Der Code in der nächsten Codezelle entspricht dem Ausführen der folgenden Befehle in einem Bash-Terminal.

export access_token=$(gcloud auth application-default print-access-token)
export project_id=my-project-id
export base_url=
import os

access_token = !gcloud auth application-default print-access-token
access_token = '\n'.join(access_token)

os.environ['access_token'] = access_token
os.environ['project_id'] = "[Enter your project-id here]"
os.environ['base_url'] = ""


access_token = !gcloud auth application-default print-access-token
access_token = '\n'.join(access_token)

project = '[Enter your project-id here]'
base_url = ""

Importieren Sie die requests-Bibliothek.

import requests
import json

Abgestimmte Modelle auflisten

Überprüfen Sie Ihre Authentifizierungseinrichtung, indem Sie die verfügbaren abgestimmten Modelle auflisten.


curl -X GET ${base_url}/v1beta/tunedModels \
    -H "Content-Type: application/json" \
    -H "Authorization: Bearer ${access_token}" \
    -H "x-goog-user-project: ${project_id}"


  'Authorization': 'Bearer ' + access_token,
  'Content-Type': 'application/json',
  'x-goog-user-project': project

result = requests.get(
  headers = headers,

Abgestimmtes Modell erstellen

Zum Erstellen eines abgestimmten Modells müssen Sie das Dataset im Feld training_data an das Modell übergeben.

In diesem Beispiel stimmen Sie ein Modell ab, um die nächste Zahl in der Sequenz zu generieren. Wenn die Eingabe beispielsweise 1 ist, sollte das Modell 2 ausgeben. Wenn die Eingabe one hundred ist, sollte die Ausgabe one hundred one sein.


curl -X POST $base_url/v1beta/tunedModels \
    -H 'Content-Type: application/json' \
    -H "Authorization: Bearer ${access_token}" \
    -H "x-goog-user-project: ${project_id}" \
    -d '
        "display_name": "number generator model",
        "base_model": "models/gemini-1.0-pro-001",
        "tuning_task": {
          "hyperparameters": {
            "batch_size": 2,
            "learning_rate": 0.001,
          "training_data": {
            "examples": {
              "examples": [
                    "text_input": "1",
                    "output": "2",
                    "text_input": "3",
                    "output": "4",
                    "text_input": "-3",
                    "output": "-2",
                    "text_input": "twenty two",
                    "output": "twenty three",
                    "text_input": "two hundred",
                    "output": "two hundred one",
                    "text_input": "ninety nine",
                    "output": "one hundred",
                    "text_input": "8",
                    "output": "9",
                    "text_input": "-98",
                    "output": "-97",
                    "text_input": "1,000",
                    "output": "1,001",
                    "text_input": "10,100,000",
                    "output": "10,100,001",
                    "text_input": "thirteen",
                    "output": "fourteen",
                    "text_input": "eighty",
                    "output": "eighty one",
                    "text_input": "one",
                    "output": "two",
                    "text_input": "three",
                    "output": "four",
                    "text_input": "seven",
                    "output": "eight",
      }' | tee tunemodel.json
"name": "tunedModels/number-generator-model-dzlmi0gswwqb/operations/bvl8dymw0fhw",
"metadata": {
  "@type": "",
  "totalSteps": 38,
  "tunedModel": "tunedModels/number-generator-model-dzlmi0gswwqb"
% Total    % Received % Xferd  Average Speed   Time    Time     Time  Current
                              Dload  Upload   Total   Spent    Left  Speed
100  2280    0   296  100  1984    611   4098 --:--:-- --:--:-- --:--:--  4720


operation =
    url = f'{base_url}/v1beta/tunedModels',
    json= {
        "display_name": "number generator",
        "base_model": "models/gemini-1.0-pro-001",
        "tuning_task": {
          "hyperparameters": {
            "batch_size": 4,
            "learning_rate": 0.001,
          "training_data": {
            "examples": {
              "examples": [
                    'text_input': '1',
                    'output': '2',
                    'text_input': '3',
                    'output': '4',
                    'text_input': '-3',
                    'output': '-2',
                    'text_input': 'twenty two',
                    'output': 'twenty three',
                    'text_input': 'two hundred',
                    'output': 'two hundred one',
                    'text_input': 'ninety nine',
                    'output': 'one hundred',
                    'text_input': '8',
                    'output': '9',
                    'text_input': '-98',
                    'output': '-97',
                    'text_input': '1,000',
                    'output': '1,001',
                    'text_input': '10,100,000',
                    'output': '10,100,001',
                    'text_input': 'thirteen',
                    'output': 'fourteen',
                    'text_input': 'eighty',
                    'output': 'eighty one',
                    'text_input': 'one',
                    'output': 'two',
                    'text_input': 'three',
                    'output': 'four',
                    'text_input': 'seven',
                    'output': 'eight',
<Response [200]>
{'name': 'tunedModels/number-generator-wl1qr34x2py/operations/41vni3zk0a47',
'metadata': {'@type': '',
  'totalSteps': 19,
  'tunedModel': 'tunedModels/number-generator-wl1qr34x2py'} }

Legen Sie eine Variable mit dem Namen Ihres abgestimmten Modells fest, das für die restlichen Aufrufe verwendet werden soll.


Abgestimmten Modellstatus abrufen

Der Status des Modells wird während des Trainings auf CREATING gesetzt und ändert sich nach Abschluss des Trainings in ACTIVE.


Unten finden Sie Python-Code zum Parsen des generierten Modellnamens aus der JSON-Antwort. Wenn Sie dies in einem Terminal ausführen, können Sie versuchen, die Antwort mit einem Bash-JSON-Parser zu parsen.

import json

first_page = json.load(open('tunemodel.json'))
os.environ['modelname'] = first_page['metadata']['tunedModel']


Führen Sie eine weitere GET-Anfrage mit dem Modellnamen aus, um die Modellmetadaten abzurufen, die das Statusfeld enthalten.

curl -X GET ${base_url}/v1beta/${modelname} \
    -H 'Content-Type: application/json' \
    -H "Authorization: Bearer ${access_token}" \
    -H "x-goog-user-project: ${project_id}" | grep state
"state": "ACTIVE",
% Total    % Received % Xferd  Average Speed   Time    Time     Time  Current
                              Dload  Upload   Total   Spent    Left  Speed
100  5921    0  5921    0     0  13164      0 --:--:-- --:--:-- --:--:-- 13157


tuned_model = requests.get(
    url = f'{base_url}/v1beta/{name}',

Der folgende Code prüft das Statusfeld alle 5 Sekunden, bis es nicht mehr den Status CREATING hat.

import time
import pprint

op_json = operation.json()
response = op_json.get('response')
error = op_json.get('error')

while response is None and error is None:

    operation = requests.get(
        url = f'{base_url}/v1/{op_json["name"]}',

    op_json = operation.json()
    response = op_json.get('response')
    error = op_json.get('error')

    percent = op_json['metadata'].get('completedPercent')
    if percent is not None:
      print(f"{percent:.2f}% - {op_json['metadata']['snapshots'][-1]}")

if error is not None:
    raise Exception(error)
100.00% - {'step': 19, 'epoch': 5, 'meanLoss': 1.402067, 'computeTime': '2024-03-14T15:11:23.766989274Z'}

Inferenz ausführen

Sobald der Abstimmungsjob abgeschlossen ist, können Sie ihn verwenden, um mit dem Textdienst Text zu generieren.


Versuchen Sie, eine römische Zahl einzugeben, z. B. 63 (LXIII):

curl -X POST $base_url/v1beta/$modelname:generateContent \
    -H 'Content-Type: application/json' \
    -H "Authorization: Bearer ${access_token}" \
    -H "x-goog-user-project: ${project_id}" \
    -d '{
        "contents": [{
        "parts": [{
          "text": "LXIII"
        }' 2> /dev/null
"candidates": [
    "content": {
      "parts": [
          "text": "LXIV"
      "role": "model"
    "finishReason": "STOP",
    "index": 0,
    "safetyRatings": [
        "probability": "NEGLIGIBLE"
        "category": "HARM_CATEGORY_HATE_SPEECH",
        "probability": "NEGLIGIBLE"
        "category": "HARM_CATEGORY_HARASSMENT",
        "probability": "NEGLIGIBLE"
        "probability": "NEGLIGIBLE"
"promptFeedback": {
  "safetyRatings": [
      "probability": "NEGLIGIBLE"
      "category": "HARM_CATEGORY_HATE_SPEECH",
      "probability": "NEGLIGIBLE"
      "category": "HARM_CATEGORY_HARASSMENT",
      "probability": "NEGLIGIBLE"
      "probability": "NEGLIGIBLE"

Die Ausgabe Ihres Modells kann korrekt sein oder nicht. Wenn das abgestimmte Modell nicht Ihren Anforderungen gerecht wird, können Sie versuchen, weitere hochwertige Beispiele hinzuzufügen, die Hyperparameter zu optimieren oder Ihren Beispielen eine Präambel hinzuzufügen. Sie können sogar ein weiteres abgestimmtes Modell erstellen, das auf dem ersten von Ihnen erstellten Modell basiert.

Weitere Informationen zum Verbessern der Leistung finden Sie im Abstimmungsleitfaden.


Versuchen Sie, eine japanische Zahl einzugeben, z. B. 6 (UDP):

import time

m =
    url = f'{base_url}/v1beta/{name}:generateContent',
    json= {
        "contents": [{
            "parts": [{
                "text": "六"
import pprint
{'candidates': [{'content': {'parts': [{'text': '七'}], 'role': 'model'},
                'finishReason': 'STOP',
                'index': 0,
                'safetyRatings': [{'category': 'HARM_CATEGORY_SEXUALLY_EXPLICIT',
                                    'probability': 'NEGLIGIBLE'},
                                  {'category': 'HARM_CATEGORY_HATE_SPEECH',
                                    'probability': 'NEGLIGIBLE'},
                                  {'category': 'HARM_CATEGORY_HARASSMENT',
                                    'probability': 'LOW'},
                                  {'category': 'HARM_CATEGORY_DANGEROUS_CONTENT',
                                    'probability': 'NEGLIGIBLE'}]}],
'promptFeedback': {'safetyRatings': [{'category': 'HARM_CATEGORY_SEXUALLY_EXPLICIT',
                                      'probability': 'NEGLIGIBLE'},
                                      {'category': 'HARM_CATEGORY_HATE_SPEECH',
                                      'probability': 'NEGLIGIBLE'},
                                      {'category': 'HARM_CATEGORY_HARASSMENT',
                                      'probability': 'NEGLIGIBLE'},
                                      {'category': 'HARM_CATEGORY_DANGEROUS_CONTENT',
                                      'probability': 'NEGLIGIBLE'}]} }

Die Ausgabe Ihres Modells kann korrekt sein oder nicht. Wenn das abgestimmte Modell nicht Ihren Anforderungen gerecht wird, können Sie versuchen, weitere hochwertige Beispiele hinzuzufügen, die Hyperparameter zu optimieren oder Ihren Beispielen eine Präambel hinzuzufügen.


Auch wenn die Trainingsdaten keinen Verweis auf römische oder japanische Zahlen enthielten, konnte das Modell nach der Feinabstimmung gut verallgemeinern. Auf diese Weise können Sie die Modelle auf Ihre Anwendungsfälle abstimmen.

Nächste Schritte

Informationen zum Verwenden des Abstimmungsdienstes mithilfe des Python SDK für die Gemini API finden Sie unter Kurzanleitung zur Abstimmung mit Python. Informationen zur Verwendung anderer Dienste in der Gemini API finden Sie in der Python-Kurzanleitung.