Tworzenie czatbota z Gemmą

Wyświetl na Uruchom w Google Colab Otwórz w Vertex AI Wyświetl źródło w GitHubie

Duże modele językowe (LLM), takie jak Gemma, doskonale nadają się do generowania przydatnych odpowiedzi, dzięki czemu idealnie nadają się do tworzenia wirtualnych asystentów i czatbotów.

Tradycyjnie duże modele językowe działają bezstanowo, co oznacza, że nie mają wbudowanej pamięci do przechowywania wcześniejszych rozmów. Każdy prompt i pytanie jest przetwarzany niezależnie, z pominięciem wcześniejszych interakcji. Kluczowym aspektem naturalnej rozmowy jest jednak zdolność do zapamiętywania kontekstu wcześniejszych interakcji. Aby przezwyciężyć to ograniczenie i umożliwić LLM zachowanie kontekstu rozmowy, muszą oni w sposób jednoznaczny otrzymywać odpowiednie informacje, takie jak historia rozmowy (lub powiązane fragmenty) do każdego nowego promptu prezentowanego LLM.

W tym samouczku pokazujemy, jak stworzyć czatbota przy użyciu wariantu Gemmy dostrojonego zgodnie z instrukcjami.


Konfiguracja Gemma

Aby ukończyć ten samouczek, musisz najpierw wykonać instrukcje konfiguracji opisane na stronie konfiguracji Gemma. Z instrukcji konfiguracji Gemma dowiesz się, jak:

  • Uzyskaj dostęp do Gemmy na
  • Wybierz środowisko wykonawcze Colab z wystarczającymi zasobami do uruchomienia modelu Gemma 2B.
  • Wygeneruj i skonfiguruj nazwę użytkownika i klucz interfejsu API Kaggle.

Po zakończeniu konfiguracji Gemma przejdź do następnej sekcji, w której możesz ustawić zmienne środowiskowe dla środowiska Colab.

Ustawianie zmiennych środowiskowych

Ustaw zmienne środowiskowe dla interfejsów KAGGLE_USERNAME i KAGGLE_KEY.

import os
from google.colab import userdata

# Note: `userdata.get` is a Colab API. If you're not using Colab, set the env
# vars as appropriate for your system.
os.environ["KAGGLE_USERNAME"] = userdata.get('KAGGLE_USERNAME')
os.environ["KAGGLE_KEY"] = userdata.get('KAGGLE_KEY')

Instalowanie zależności

Zainstaluj Keras i KerasNLP.

# Install Keras 3 last. See for more details.
pip install -q tensorflow-cpu
pip install -q -U keras-nlp tensorflow-hub
pip install -q -U keras>=3
pip install -q -U tensorflow-text

Wybierz backend

Keras to wysokopoziomowy, wieloramowy interfejs API deep learning, który został zaprojektowany z myślą o łatwości obsługi. Keras 3 pozwala wybrać backend: TensorFlow, JAX lub PyTorch. W tym samouczku będą działać wszystkie 3 metody.

import os

# Select JAX as the backend
os.environ["KERAS_BACKEND"] = "jax"

# Pre-allocate 100% of TPU memory to minimize memory fragmentation
os.environ["XLA_PYTHON_CLIENT_MEM_FRACTION"] = "1.0"

Importuj pakiety

Importuj Keras i KerasNLP.

import keras
import keras_nlp

# for reproducibility

Utwórz instancję modelu

KerasNLP udostępnia implementacje wielu popularnych architektur modeli. W tym samouczku utworzysz instancję modelu przy użyciu GemmaCausalLM – kompleksowego modelu Gemma do modelowania przyczynowego języka. Przypadkowy model językowy przewiduje kolejny token na podstawie poprzednich tokenów.

Utwórz instancję modelu przy użyciu metody from_preset:

gemma_lm = keras_nlp.models.GemmaCausalLM.from_preset("gemma_1.1_instruct_2b_en")
Attaching 'metadata.json' from model 'keras/gemma/keras/gemma_1.1_instruct_2b_en/3' to your Colab notebook...
Attaching 'metadata.json' from model 'keras/gemma/keras/gemma_1.1_instruct_2b_en/3' to your Colab notebook...
Attaching 'task.json' from model 'keras/gemma/keras/gemma_1.1_instruct_2b_en/3' to your Colab notebook...
Attaching 'config.json' from model 'keras/gemma/keras/gemma_1.1_instruct_2b_en/3' to your Colab notebook...
Attaching 'metadata.json' from model 'keras/gemma/keras/gemma_1.1_instruct_2b_en/3' to your Colab notebook...
Attaching 'metadata.json' from model 'keras/gemma/keras/gemma_1.1_instruct_2b_en/3' to your Colab notebook...
Attaching 'config.json' from model 'keras/gemma/keras/gemma_1.1_instruct_2b_en/3' to your Colab notebook...
Attaching 'config.json' from model 'keras/gemma/keras/gemma_1.1_instruct_2b_en/3' to your Colab notebook...
Attaching 'model.weights.h5' from model 'keras/gemma/keras/gemma_1.1_instruct_2b_en/3' to your Colab notebook...
Attaching 'metadata.json' from model 'keras/gemma/keras/gemma_1.1_instruct_2b_en/3' to your Colab notebook...
Attaching 'metadata.json' from model 'keras/gemma/keras/gemma_1.1_instruct_2b_en/3' to your Colab notebook...
Attaching 'preprocessor.json' from model 'keras/gemma/keras/gemma_1.1_instruct_2b_en/3' to your Colab notebook...
Attaching 'tokenizer.json' from model 'keras/gemma/keras/gemma_1.1_instruct_2b_en/3' to your Colab notebook...
Attaching 'tokenizer.json' from model 'keras/gemma/keras/gemma_1.1_instruct_2b_en/3' to your Colab notebook...
Attaching 'assets/tokenizer/vocabulary.spm' from model 'keras/gemma/keras/gemma_1.1_instruct_2b_en/3' to your Colab notebook...

Funkcja GemmaCausalLM.from_preset() tworzy instancję modelu na podstawie gotowej architektury i wag. W powyższym kodzie ciąg "gemma_1.1_instruct_2b_en" określa gotowe ustawienie modelu Gemma 2B z 2 miliardami parametrów. Dostępne są również modele Gemma z parametrami 7B, 9B i 27B. Ciągi kodu dla modeli Gemma znajdziesz na stronie Odmiana modelu na stronie Kaggle.

Aby uzyskać więcej informacji o modelu, użyj metody summary:


Jak widać z podsumowania, model ma 2,5 mld parametrów z możliwością trenowania.

Zdefiniuj funkcje pomocnicze formatowania

from IPython.display import Markdown
import textwrap

def display_chat(prompt, text):
  formatted_prompt = "<font size='+1' color='brown'>🙋‍♂️<blockquote>" + prompt + "</blockquote></font>"
  text = text.replace('•', '  *')
  text = textwrap.indent(text, '> ', predicate=lambda _: True)
  formatted_text = "<font size='+1' color='teal'>🤖\n\n" + text + "\n</font>"
  return Markdown(formatted_prompt+formatted_text)

def to_markdown(text):
  text = text.replace('•', '  *')
  return Markdown(textwrap.indent(text, '> ', predicate=lambda _: True))

Tworzenie czatbota

Model gemma_1.1_instruct_2b_en dostrojony przez Gemma został dostrojony pod kątem rozpoznawania tych tokenów skrętu:

<start_of_turn>user\n  ... <end_of_turn>\n
<start_of_turn>model\n ... <end_of_turn>\n

Ten samouczek korzysta z tych tokenów do budowania czatbota. Więcej informacji o tokenach kontrolnych Gemma znajdziesz w instrukcjach formatowania i systemu.

Utwórz pomocnik na czacie do zarządzania stanem rozmowy

class ChatState():
  Manages the conversation history for a turn-based chatbot
  Follows the turn-based conversation guidelines for the Gemma family of models
  documented at

  __START_TURN_USER__ = "<start_of_turn>user\n"
  __START_TURN_MODEL__ = "<start_of_turn>model\n"
  __END_TURN__ = "<end_of_turn>\n"

  def __init__(self, model, system=""):
    Initializes the chat state.

        model: The language model to use for generating responses.
        system: (Optional) System instructions or bot description.
    self.model = model
    self.system = system
    self.history = []

  def add_to_history_as_user(self, message):
      Adds a user message to the history with start/end turn markers.
      self.history.append(self.__START_TURN_USER__ + message + self.__END_TURN__)

  def add_to_history_as_model(self, message):
      Adds a model response to the history with start/end turn markers.
      self.history.append(self.__START_TURN_MODEL__ + message + self.__END_TURN__)

  def get_history(self):
      Returns the entire chat history as a single string.
      return "".join([*self.history])

  def get_full_prompt(self):
    Builds the prompt for the language model, including history and system description.
    prompt = self.get_history() + self.__START_TURN_MODEL__
    if len(self.system)>0:
      prompt = self.system + "\n" + prompt
    return prompt

  def send_message(self, message):
    Handles sending a user message and getting a model response.

        message: The user's message.

        The model's response.
    prompt = self.get_full_prompt()
    response = self.model.generate(prompt, max_length=1024)
    result = response.replace(prompt, "")  # Extract only the new response
    return result

Czatuj z modelem

Rozpocznij czat z modelem.

chat = ChatState(gemma_lm)
message = "Tell me, in a few words,  how to compute all prime numbers up to 1000?"
display_chat(message, chat.send_message(message))


Powiedz mi w kilku słowach, jak obliczyć wszystkie liczby pierwsze do 1000?

Sieść Eratotenów jest powszechnie stosowaną metodą obliczania wszystkich liczb pierwszych do określonego limitu. Polega ona na oznaczaniu wielokrotności każdej liczby pierwszą.

Kontynuuj rozmowę.

message = "Now in Python! No numpy, please!"
display_chat(message, chat.send_message(message))


Teraz w Pythonie! Uwaga!

def prime(n):
    if n <= 1:
        return False
    for i in range(2, int(n**0.5) + 1):
        if n % i == 0:
            return False
    return True

message = "Thank you, it works! Can you explain the code in plain English?"
display_chat(message, chat.send_message(message))


Dziękujemy, to działa. Czy możesz wyjaśnić kod po angielsku?

Podany kod definiuje funkcję prime, która sprawdza, czy podana liczba jest liczbą pierwszą.

Jak to działa:

  • Funkcja przyjmuje pojedynczy argument (n), który jest liczbą do sprawdzenia.

  • Najpierw sprawdza, czy n ma wartość mniejszą niż 1 lub równą 1. Jeśli tak, liczba nie jest liczbą pierwszą, więc funkcja zwraca False.

  • Następnie powstaje pętla, która powtarza kolejne liczby od 2 do pierwiastka kwadratowego z n.

  • W przypadku każdej liczby i sprawdza, czy element n jest podzielny równomiernie przez i (tzn. n % i == 0).

  • Jeśli n jest podzielna przez i, funkcja zwraca False, ponieważ n nie może być liczbą pierwszą, jeśli ma dzielnik.

  • Jeśli pętla zakończy się bez znalezienia dzielnika funkcji n, funkcja zwraca True, co oznacza, że n jest liczbą pierwszą.

Przykład użycia:

>>> prime(2)
>>> prime(3)
>>> prime(4)
>>> prime(5)

Zalety kodu:

  • To prosty i wydajny algorytm wyszukiwania liczb pierwszych.
  • Jest powszechnie stosowany w różnych zastosowaniach informatycznych i matematycznych.
message = "Great! Now add those explanations as comments in the code."
display_chat(message, chat.send_message(message))


Świetnie. Teraz dodaj te wyjaśnienia jako komentarze w kodzie.

def prime(n):
    Checks whether a given number is prime or not.

        n: The number to check.

        True if n is prime, False otherwise.

    # Check if n is less than or equal to 1.
    if n <= 1:
        return False

    # Iterate through numbers from 2 to the square root of n.
    for i in range(2, int(n**0.5) + 1):
        # Check if n is divisible by i.
        if n % i == 0:
            return False

    # If the loop completes without finding any divisors for n, then n is prime.
    return True

Przetestuj wygenerowaną odpowiedź, uruchamiając wygenerowany kod:

def is_prime(n):
  Checks if a number is prime.

    n: The number to check.

    True if n is prime, False otherwise.

  # If n is less than or equal to 1, it is not prime.
  if n <= 1:
    return False

  # Iterate through all the numbers from 2 to the square root of n.
  for i in range(2, int(n**0.5) + 1):
    # If n is divisible by any of the numbers in the range from 2 to the square root of n, it is not prime.
    if n % i == 0:
      return False

  # If no divisors are found, n is prime.
  return True

# Initialize an empty list to store prime numbers.
primes = []

# Iterate through all the numbers from 2 to 1000.
for i in range(2, 1001):
  # If the number is prime, add it to the list.
  if is_prime(i):

# Print the prime numbers.
[2, 3, 5, 7, 11, 13, 17, 19, 23, 29, 31, 37, 41, 43, 47, 53, 59, 61, 67, 71, 73, 79, 83, 89, 97, 101, 103, 107, 109, 113, 127, 131, 137, 139, 149, 151, 157, 163, 167, 173, 179, 181, 191, 193, 197, 199, 211, 223, 227, 229, 233, 239, 241, 251, 257, 263, 269, 271, 277, 281, 283, 293, 307, 311, 313, 317, 331, 337, 347, 349, 353, 359, 367, 373, 379, 383, 389, 397, 401, 409, 419, 421, 431, 433, 439, 443, 449, 457, 461, 463, 467, 479, 487, 491, 499, 503, 509, 521, 523, 541, 547, 557, 563, 569, 571, 577, 587, 593, 599, 601, 607, 613, 617, 619, 631, 641, 643, 647, 653, 659, 661, 673, 677, 683, 691, 701, 709, 719, 727, 733, 739, 743, 751, 757, 761, 769, 773, 787, 797, 809, 811, 821, 823, 827, 829, 839, 853, 857, 859, 863, 877, 881, 883, 887, 907, 911, 919, 929, 937, 941, 947, 953, 967, 971, 977, 983, 991, 997]

Użyj metody get_history, aby zobaczyć, jak cały kontekst został zachowany przez klasę Chat.

Tell me, in a few words,  how to compute all prime numbers up to 1000?<end_of_turn>
The Sieve of Eratosthenes is a widely used method to compute all prime numbers up to a given limit. It involves iteratively marking out multiples of each prime number.<end_of_turn>
Now in Python! No numpy, please!<end_of_turn>

def prime(n):
    if n <= 1:
        return False
    for i in range(2, int(n**0.5) + 1):
        if n % i == 0:
            return False
    return True
Thank you, it works! Can you explain the code in plain English?<end_of_turn>
The provided code defines a function `prime` that checks whether a given number is prime or not.

**How it works:**

- The function takes a single argument, `n`, which is the number to check.

- It first checks if `n` is less than or equal to 1. If it is, the number is not prime, so the function returns `False`.

- It then enters a loop that iterates through numbers from 2 to the square root of `n`.

- For each number `i`, it checks if `n` is divisible evenly by `i` (i.e., `n % i == 0`).

- If `n` is divisible by `i`, the function returns `False` because `n` cannot be prime if it has a divisor.

- If the loop completes without finding any divisors for `n`, the function returns `True`, indicating that `n` is a prime number.

**Example Usage:**

>>> prime(2)
>>> prime(3)
>>> prime(4)
>>> prime(5)

**Benefits of this Code:**

- It is a simple and efficient algorithm for finding prime numbers.
- It is widely used in various computer science and mathematical applications.<end_of_turn>
Great! Now add those explanations as comments in the code.<end_of_turn>
def prime(n):
    Checks whether a given number is prime or not.

        n: The number to check.

        True if n is prime, False otherwise.

    # Check if n is less than or equal to 1.
    if n <= 1:
        return False

    # Iterate through numbers from 2 to the square root of n.
    for i in range(2, int(n**0.5) + 1):
        # Check if n is divisible by i.
        if n % i == 0:
            return False

    # If the loop completes without finding any divisors for n, then n is prime.
    return True

Podsumowanie i dalsze materiały

Z tego samouczka dowiesz się, jak czatować z modelem dostrojonym w narzędziu Gemma 2B Instruction z wykorzystaniem Keras w języku JAX.

Zapoznaj się z tymi przewodnikami i samouczkami, aby dowiedzieć się więcej o Gemmie: