สร้างแชทบ็อตกับ Gemma

ดูใน ai.google.dev เรียกใช้ใน Google Colab เปิดใน Vertex AI ดูแหล่งที่มาใน GitHub

โมเดลภาษาขนาดใหญ่ (LLM) เช่น Gemma เชี่ยวชาญในการสร้างคำตอบที่เป็นประโยชน์ จึงเหมาะอย่างยิ่งสำหรับการสร้างผู้ช่วยเสมือนและแชทบ็อต

โดยทั่วไปแล้ว LLM ทำงานในลักษณะที่ไม่เก็บสถานะ หมายความว่าไม่มีหน่วยความจำส่วนตัวสำหรับจัดเก็บการสนทนาในอดีต พรอมต์หรือคำถามแต่ละรายการจะได้รับการประมวลผลแยกกัน โดยไม่คำนึงถึงการโต้ตอบก่อนหน้านี้ อย่างไรก็ตาม แง่มุมสำคัญของการสนทนาอย่างเป็นธรรมชาติคือความสามารถในการรักษาบริบทจากการโต้ตอบก่อนหน้านี้ หากต้องการก้าวข้ามข้อจำกัดนี้และทำให้ LLM รักษาบริบทการสนทนาได้ คุณต้องให้ข้อมูลที่เกี่ยวข้องอย่างชัดเจน เช่น ประวัติการสนทนา (หรือส่วนที่เกี่ยวข้อง) ในพรอมต์ใหม่แต่ละรายการที่แสดงต่อ LLM

บทแนะนำนี้จะแสดงวิธีพัฒนาแชทบ็อตโดยใช้ตัวแปรโมเดลที่ปรับแต่งตามวิธีการของ Gemma


การตั้งค่า Gemma

หากต้องการจบบทแนะนำนี้ คุณจะต้องทำตามวิธีการตั้งค่าที่การตั้งค่า Gemma ก่อน วิธีการตั้งค่า Gemma จะแสดงวิธีดำเนินการต่อไปนี้

  • เข้าถึง Gemma ใน kaggle.com
  • เลือกรันไทม์ของ Colab ที่มีทรัพยากรเพียงพอที่จะเรียกใช้โมเดล Gemma 2B
  • สร้างและกำหนดค่าชื่อผู้ใช้และคีย์ API ของ Kaggle

หลังจากตั้งค่า Gemma เสร็จแล้ว ให้ไปยังส่วนถัดไปซึ่งจะตั้งค่าตัวแปรสภาพแวดล้อมสำหรับสภาพแวดล้อม Colab


ตั้งค่าตัวแปรสภาพแวดล้อมสำหรับ KAGGLE_USERNAME และ KAGGLE_KEY

import os
from google.colab import userdata

# Note: `userdata.get` is a Colab API. If you're not using Colab, set the env
# vars as appropriate for your system.
os.environ["KAGGLE_USERNAME"] = userdata.get('KAGGLE_USERNAME')
os.environ["KAGGLE_KEY"] = userdata.get('KAGGLE_KEY')


ติดตั้ง Keras และ KerasNLP

# Install Keras 3 last. See https://keras.io/getting_started/ for more details.
pip install -q tensorflow-cpu
pip install -q -U keras-nlp tensorflow-hub
pip install -q -U keras>=3
pip install -q -U tensorflow-text


Keras เป็น API การเรียนรู้เชิงลึกที่มีหลายกรอบและมีระดับสูงซึ่งออกแบบมาให้ใช้งานง่าย Keras 3 ให้คุณเลือกแบ็กเอนด์ ได้แก่ TensorFlow, JAX หรือ PyTorch ทั้ง 3 วิธีนี้เหมาะกับบทแนะนำนี้

import os

# Select JAX as the backend
os.environ["KERAS_BACKEND"] = "jax"

# Pre-allocate 100% of TPU memory to minimize memory fragmentation
os.environ["XLA_PYTHON_CLIENT_MEM_FRACTION"] = "1.0"


นำเข้า Keras และ KerasNLP

import keras
import keras_nlp

# for reproducibility


KerasNLP ให้บริการนำสถาปัตยกรรมโมเดลยอดนิยมจำนวนมากมาใช้ ในบทแนะนำนี้ คุณจะได้สร้างอินสแตนซ์ของโมเดลโดยใช้ GemmaCausalLM ซึ่งเป็นโมเดล Gemma จากต้นทางถึงปลายทางสำหรับโมเดลภาษาทั่วไป โมเดลภาษาทั่วไปจะคาดการณ์โทเค็นถัดไปตามโทเค็นก่อนหน้า

สร้างอินสแตนซ์โมเดลโดยใช้เมธอด from_preset:

gemma_lm = keras_nlp.models.GemmaCausalLM.from_preset("gemma_1.1_instruct_2b_en")
Attaching 'metadata.json' from model 'keras/gemma/keras/gemma_1.1_instruct_2b_en/3' to your Colab notebook...
Attaching 'metadata.json' from model 'keras/gemma/keras/gemma_1.1_instruct_2b_en/3' to your Colab notebook...
Attaching 'task.json' from model 'keras/gemma/keras/gemma_1.1_instruct_2b_en/3' to your Colab notebook...
Attaching 'config.json' from model 'keras/gemma/keras/gemma_1.1_instruct_2b_en/3' to your Colab notebook...
Attaching 'metadata.json' from model 'keras/gemma/keras/gemma_1.1_instruct_2b_en/3' to your Colab notebook...
Attaching 'metadata.json' from model 'keras/gemma/keras/gemma_1.1_instruct_2b_en/3' to your Colab notebook...
Attaching 'config.json' from model 'keras/gemma/keras/gemma_1.1_instruct_2b_en/3' to your Colab notebook...
Attaching 'config.json' from model 'keras/gemma/keras/gemma_1.1_instruct_2b_en/3' to your Colab notebook...
Attaching 'model.weights.h5' from model 'keras/gemma/keras/gemma_1.1_instruct_2b_en/3' to your Colab notebook...
Attaching 'metadata.json' from model 'keras/gemma/keras/gemma_1.1_instruct_2b_en/3' to your Colab notebook...
Attaching 'metadata.json' from model 'keras/gemma/keras/gemma_1.1_instruct_2b_en/3' to your Colab notebook...
Attaching 'preprocessor.json' from model 'keras/gemma/keras/gemma_1.1_instruct_2b_en/3' to your Colab notebook...
Attaching 'tokenizer.json' from model 'keras/gemma/keras/gemma_1.1_instruct_2b_en/3' to your Colab notebook...
Attaching 'tokenizer.json' from model 'keras/gemma/keras/gemma_1.1_instruct_2b_en/3' to your Colab notebook...
Attaching 'assets/tokenizer/vocabulary.spm' from model 'keras/gemma/keras/gemma_1.1_instruct_2b_en/3' to your Colab notebook...

ฟังก์ชัน GemmaCausalLM.from_preset() จะสร้างอินสแตนซ์โมเดลจากสถาปัตยกรรมและน้ำหนักที่กำหนดไว้ล่วงหน้า ในโค้ดข้างต้น สตริง "gemma_1.1_instruct_2b_en" ระบุค่าที่กำหนดล่วงหน้าของโมเดล Gemma 2B ที่มีพารามิเตอร์ 2 พันล้านรายการ นอกจากนี้ยังมีโมเดล Gemma ที่มีพารามิเตอร์ 7B, 9B และ 27B ให้ใช้งานด้วย คุณดูสตริงโค้ดสำหรับโมเดล Gemma ได้ในรูปแบบโมเดลใน Kaggle

ใช้เมธอด summary เพื่อดูข้อมูลเพิ่มเติมเกี่ยวกับโมเดล


จากข้อมูลสรุปจะเห็นได้ว่าโมเดลนี้มีพารามิเตอร์ที่ฝึกได้ 2.5 พันล้านรายการ


from IPython.display import Markdown
import textwrap

def display_chat(prompt, text):
  formatted_prompt = "<font size='+1' color='brown'>🙋‍♂️<blockquote>" + prompt + "</blockquote></font>"
  text = text.replace('•', '  *')
  text = textwrap.indent(text, '> ', predicate=lambda _: True)
  formatted_text = "<font size='+1' color='teal'>🤖\n\n" + text + "\n</font>"
  return Markdown(formatted_prompt+formatted_text)

def to_markdown(text):
  text = text.replace('•', '  *')
  return Markdown(textwrap.indent(text, '> ', predicate=lambda _: True))


โมเดล gemma_1.1_instruct_2b_en ที่ปรับแต่งตามคำสั่งของ Gemma ได้รับการปรับแต่งเพื่อให้เข้าใจโทเค็นการเลี้ยวต่อไปนี้

<start_of_turn>user\n  ... <end_of_turn>\n
<start_of_turn>model\n ... <end_of_turn>\n

บทแนะนำนี้ใช้โทเค็นเหล่านี้เพื่อสร้างแชทบ็อต โปรดดูข้อมูลเพิ่มเติมเกี่ยวกับโทเค็นการควบคุม Gemma ที่หัวข้อการจัดรูปแบบและวิธีการของระบบ


class ChatState():
  Manages the conversation history for a turn-based chatbot
  Follows the turn-based conversation guidelines for the Gemma family of models
  documented at https://ai.google.dev/gemma/docs/formatting

  __START_TURN_USER__ = "<start_of_turn>user\n"
  __START_TURN_MODEL__ = "<start_of_turn>model\n"
  __END_TURN__ = "<end_of_turn>\n"

  def __init__(self, model, system=""):
    Initializes the chat state.

        model: The language model to use for generating responses.
        system: (Optional) System instructions or bot description.
    self.model = model
    self.system = system
    self.history = []

  def add_to_history_as_user(self, message):
      Adds a user message to the history with start/end turn markers.
      self.history.append(self.__START_TURN_USER__ + message + self.__END_TURN__)

  def add_to_history_as_model(self, message):
      Adds a model response to the history with start/end turn markers.
      self.history.append(self.__START_TURN_MODEL__ + message + self.__END_TURN__)

  def get_history(self):
      Returns the entire chat history as a single string.
      return "".join([*self.history])

  def get_full_prompt(self):
    Builds the prompt for the language model, including history and system description.
    prompt = self.get_history() + self.__START_TURN_MODEL__
    if len(self.system)>0:
      prompt = self.system + "\n" + prompt
    return prompt

  def send_message(self, message):
    Handles sending a user message and getting a model response.

        message: The user's message.

        The model's response.
    prompt = self.get_full_prompt()
    response = self.model.generate(prompt, max_length=1024)
    result = response.replace(prompt, "")  # Extract only the new response
    return result



chat = ChatState(gemma_lm)
message = "Tell me, in a few words,  how to compute all prime numbers up to 1000?"
display_chat(message, chat.send_message(message))


บอกวิธีคำนวณจำนวนเฉพาะทั้งหมดให้ได้ 1,000 คำสั้นๆ หน่อย

Sieve of Eratosthenes เป็นวิธีการที่ใช้กันอย่างแพร่หลายในการคำนวณจำนวนเฉพาะทั้งหมดจนถึงขีดจำกัดที่กำหนด ซึ่งเกี่ยวข้องกับการทำเครื่องหมายจำนวนพหุคูณของจำนวนเฉพาะแต่ละจำนวน


message = "Now in Python! No numpy, please!"
display_chat(message, chat.send_message(message))


อยู่ใน Python แล้ว! ไม่เอาน่า งั้นก็

def prime(n):
    if n <= 1:
        return False
    for i in range(2, int(n**0.5) + 1):
        if n % i == 0:
            return False
    return True

message = "Thank you, it works! Can you explain the code in plain English?"
display_chat(message, chat.send_message(message))


ขอบคุณ ทุกอย่างใช้งานได้แล้ว ช่วยอธิบายโค้ดเป็นภาษาอังกฤษง่ายๆ ได้ไหม

โค้ดที่ให้มาจะกำหนดฟังก์ชัน prime ที่ตรวจสอบว่าตัวเลขที่ระบุเป็นเลขเฉพาะหรือไม่


  • ฟังก์ชันนี้รับอาร์กิวเมนต์เดียว คือ n ซึ่งเป็นตัวเลขที่จะตรวจสอบ

  • โดยจะตรวจสอบว่า n น้อยกว่าหรือเท่ากับ 1 หรือไม่ก่อน หากใช่ จำนวนไม่ใช่ค่าเฉพาะ ฟังก์ชันจึงแสดงผล False

  • จากนั้นป้อนลูปที่วนซ้ำผ่านตัวเลขจาก 2 ถึงรากที่ 2 ของ n

  • สำหรับแต่ละตัวเลข i ระบบจะตรวจสอบว่า n หาร i อย่างเท่าๆ กันหรือไม่ (นั่นคือ n % i == 0).

  • หาก n หารด้วย i ฟังก์ชันจะแสดงผล False เนื่องจาก n จะเป็นตัวหารไม่ได้หากมีตัวหาร

  • หากวนซ้ำโดยไม่มีตัวหารสำหรับ n ฟังก์ชันจะแสดงผล True ซึ่งบ่งบอกว่า n เป็นจำนวนเฉพาะ


>>> prime(2)
>>> prime(3)
>>> prime(4)
>>> prime(5)


  • โดยเป็นอัลกอริทึมที่เรียบง่ายและมีประสิทธิภาพสำหรับการค้นหาจำนวนเฉพาะ
  • ใช้กันอย่างแพร่หลายในวิทยาการคอมพิวเตอร์และแอปพลิเคชันทางคณิตศาสตร์
message = "Great! Now add those explanations as comments in the code."
display_chat(message, chat.send_message(message))


เยี่ยมมาก เพิ่มคำอธิบายเหล่านั้นเป็นความคิดเห็นในโค้ด

def prime(n):
    Checks whether a given number is prime or not.

        n: The number to check.

        True if n is prime, False otherwise.

    # Check if n is less than or equal to 1.
    if n <= 1:
        return False

    # Iterate through numbers from 2 to the square root of n.
    for i in range(2, int(n**0.5) + 1):
        # Check if n is divisible by i.
        if n % i == 0:
            return False

    # If the loop completes without finding any divisors for n, then n is prime.
    return True


def is_prime(n):
  Checks if a number is prime.

    n: The number to check.

    True if n is prime, False otherwise.

  # If n is less than or equal to 1, it is not prime.
  if n <= 1:
    return False

  # Iterate through all the numbers from 2 to the square root of n.
  for i in range(2, int(n**0.5) + 1):
    # If n is divisible by any of the numbers in the range from 2 to the square root of n, it is not prime.
    if n % i == 0:
      return False

  # If no divisors are found, n is prime.
  return True

# Initialize an empty list to store prime numbers.
primes = []

# Iterate through all the numbers from 2 to 1000.
for i in range(2, 1001):
  # If the number is prime, add it to the list.
  if is_prime(i):

# Print the prime numbers.
[2, 3, 5, 7, 11, 13, 17, 19, 23, 29, 31, 37, 41, 43, 47, 53, 59, 61, 67, 71, 73, 79, 83, 89, 97, 101, 103, 107, 109, 113, 127, 131, 137, 139, 149, 151, 157, 163, 167, 173, 179, 181, 191, 193, 197, 199, 211, 223, 227, 229, 233, 239, 241, 251, 257, 263, 269, 271, 277, 281, 283, 293, 307, 311, 313, 317, 331, 337, 347, 349, 353, 359, 367, 373, 379, 383, 389, 397, 401, 409, 419, 421, 431, 433, 439, 443, 449, 457, 461, 463, 467, 479, 487, 491, 499, 503, 509, 521, 523, 541, 547, 557, 563, 569, 571, 577, 587, 593, 599, 601, 607, 613, 617, 619, 631, 641, 643, 647, 653, 659, 661, 673, 677, 683, 691, 701, 709, 719, 727, 733, 739, 743, 751, 757, 761, 769, 773, 787, 797, 809, 811, 821, 823, 827, 829, 839, 853, 857, 859, 863, 877, 881, 883, 887, 907, 911, 919, 929, 937, 941, 947, 953, 967, 971, 977, 983, 991, 997]

ใช้เมธอด get_history เพื่อดูวิธีที่คลาส Chat เก็บรักษาบริบททั้งหมดไว้

Tell me, in a few words,  how to compute all prime numbers up to 1000?<end_of_turn>
The Sieve of Eratosthenes is a widely used method to compute all prime numbers up to a given limit. It involves iteratively marking out multiples of each prime number.<end_of_turn>
Now in Python! No numpy, please!<end_of_turn>

def prime(n):
    if n <= 1:
        return False
    for i in range(2, int(n**0.5) + 1):
        if n % i == 0:
            return False
    return True
Thank you, it works! Can you explain the code in plain English?<end_of_turn>
The provided code defines a function `prime` that checks whether a given number is prime or not.

**How it works:**

- The function takes a single argument, `n`, which is the number to check.

- It first checks if `n` is less than or equal to 1. If it is, the number is not prime, so the function returns `False`.

- It then enters a loop that iterates through numbers from 2 to the square root of `n`.

- For each number `i`, it checks if `n` is divisible evenly by `i` (i.e., `n % i == 0`).

- If `n` is divisible by `i`, the function returns `False` because `n` cannot be prime if it has a divisor.

- If the loop completes without finding any divisors for `n`, the function returns `True`, indicating that `n` is a prime number.

**Example Usage:**

>>> prime(2)
>>> prime(3)
>>> prime(4)
>>> prime(5)

**Benefits of this Code:**

- It is a simple and efficient algorithm for finding prime numbers.
- It is widely used in various computer science and mathematical applications.<end_of_turn>
Great! Now add those explanations as comments in the code.<end_of_turn>
def prime(n):
    Checks whether a given number is prime or not.

        n: The number to check.

        True if n is prime, False otherwise.

    # Check if n is less than or equal to 1.
    if n <= 1:
        return False

    # Iterate through numbers from 2 to the square root of n.
    for i in range(2, int(n**0.5) + 1):
        # Check if n is divisible by i.
        if n % i == 0:
            return False

    # If the loop completes without finding any divisors for n, then n is prime.
    return True


ในบทแนะนำนี้ คุณได้เรียนรู้วิธีแชทกับโมเดลที่ปรับแต่ง Gemma 2B Instruction โดยใช้ Keras ใน JAX

ดูข้อมูลเพิ่มเติมเกี่ยวกับ Gemma ได้ในคู่มือและบทแนะนำเหล่านี้