ai.google.dev पर देखें | Google Colab में चलाएं | Vertex AI में खोलें | GitHub पर सोर्स देखें |
जेमा जैसे बड़े लैंग्वेज मॉडल (एलएलएम), जानकारी देने वाले जवाब जनरेट करने में माहिर होते हैं. इस वजह से, ये वर्चुअल असिस्टेंट और चैटबॉट बनाने के लिए सबसे सही होते हैं.
परंपरागत तौर पर, एलएलएम स्टेटलेस तरीके से काम करते हैं. इसका मतलब है कि उनके पास पुरानी बातचीत को सेव करने के लिए मेमोरी नहीं होती है. हर सवाल या सवाल को, पहले के इंटरैक्शन पर ध्यान दिए बिना अलग से प्रोसेस किया जाता है. हालांकि, सामान्य बातचीत का एक अहम पहलू यह है कि पहले की बातचीत के संदर्भ को याद रखा जा सके. इस सीमा को पार करने और बातचीत के कॉन्टेक्स्ट को बनाए रखने के लिए, एलएलएम को हर नए प्रॉम्प्ट में साफ़ तौर पर, बातचीत का इतिहास या ज़रूरी हिस्से जैसी ज़रूरी जानकारी देनी होगी.
इस ट्यूटोरियल में बताया गया है कि Gemma के निर्देशों वाले मॉडल वैरिएंट का इस्तेमाल करके, चैटबॉट कैसे बनाएं.
सेटअप
Gemma का सेटअप
इस ट्यूटोरियल को पूरा करने के लिए, आपको सबसे पहले Gemma सेटअप में दिए गए सेटअप के निर्देशों को पूरा करना होगा. Gemma के सेटअप से जुड़े निर्देशों में बताया गया है कि ये काम कैसे किए जा सकते हैं:
- kaggle.com पर Gemma का ऐक्सेस पाएं.
- ऐसा Colab रनटाइम चुनें जिसमें चलाने के लिए ज़रूरी संसाधन हों जेमा 2B मॉडल.
- Kaggle उपयोगकर्ता नाम और एपीआई पासकोड को जनरेट और कॉन्फ़िगर करें.
Gemma का सेटअप पूरा करने के बाद, अगले सेक्शन पर जाएं. यहां अपने Colab एनवायरमेंट के लिए, एनवायरमेंट वैरिएबल सेट किए जा सकते हैं.
एनवायरमेंट वैरिएबल सेट करना
KAGGLE_USERNAME
और KAGGLE_KEY
के लिए, एनवायरमेंट वैरिएबल सेट करें.
import os
from google.colab import userdata
# Note: `userdata.get` is a Colab API. If you're not using Colab, set the env
# vars as appropriate for your system.
os.environ["KAGGLE_USERNAME"] = userdata.get('KAGGLE_USERNAME')
os.environ["KAGGLE_KEY"] = userdata.get('KAGGLE_KEY')
डिपेंडेंसी इंस्टॉल करें
Keras और KerasNLP इंस्टॉल करें.
# Install Keras 3 last. See https://keras.io/getting_started/ for more details.
pip install -q tensorflow-cpu
pip install -q -U keras-nlp tensorflow-hub
pip install -q -U "keras>=3"
pip install -q -U tensorflow-text
बैकएंड चुनें
Keras एक हाई-लेवल, मल्टी-फ़्रेमवर्क डीप लर्निंग एपीआई है. इसे सरलता और इस्तेमाल में आसानी के लिए डिज़ाइन किया गया है. Keras 3 की मदद से, बैकएंड में इनमें से कोई भी विकल्प चुना जा सकता है: TensorFlow, JAX या PyTorch. इस ट्यूटोरियल के लिए ये तीनों काम करेंगे.
import os
# Select JAX as the backend
os.environ["KERAS_BACKEND"] = "jax"
# Pre-allocate 100% of TPU memory to minimize memory fragmentation
os.environ["XLA_PYTHON_CLIENT_MEM_FRACTION"] = "1.0"
पैकेज इंपोर्ट करें
Keras और KerasNLP इंपोर्ट करें.
import keras
import keras_nlp
# for reproducibility
keras.utils.set_random_seed(42)
मॉडल को इंस्टैंशिएट करना
KerasNLP कई लोकप्रिय मॉडल आर्किटेक्चर को लागू करने की सुविधा देता है. इस ट्यूटोरियल में, GemmaCausalLM
का इस्तेमाल करके मॉडल को इंस्टैंशिएट किया जाएगा. यह टाइम-टू-एंड जेमा मॉडल है, जो किसी भाषा के सामान्य मॉडल के लिए इस्तेमाल किया जाता है. कॉज़ल लैंग्वेज मॉडल, पिछले टोकन के आधार पर अगले टोकन का अनुमान लगाता है.
from_preset
तरीके का इस्तेमाल करके मॉडल को इंस्टैंशिएट करें:
gemma_lm = keras_nlp.models.GemmaCausalLM.from_preset("gemma2_instruct_2b_en")
GemmaCausalLM.from_preset()
फ़ंक्शन, मॉडल को प्रीसेट आर्किटेक्चर और वेट से इंस्टैंशिएट करता है. ऊपर दिए गए कोड में, "gemma2_instruct_2b_en"
स्ट्रिंग में 2 अरब पैरामीटर के साथ Gemma 2 2B मॉडल को पहले से सेट किया गया है. 7B, 9B, और 27B पैरामीटर वाले जेमा मॉडल भी उपलब्ध हैं. Gemma मॉडल के लिए कोड स्ट्रिंग, Kaggle पर उनकी मॉडल वैरिएशन लिस्टिंग में देखी जा सकती हैं.
मॉडल के बारे में ज़्यादा जानकारी पाने के लिए, summary
तरीके का इस्तेमाल करें:
gemma_lm.summary()
खास जानकारी से साफ़ तौर पर पता चलता है कि इस मॉडल में ट्रेनिंग देने लायक 2.6 अरब पैरामीटर हैं.
फ़ॉर्मैटिंग हेल्पर फ़ंक्शन तय करना
from IPython.display import Markdown
import textwrap
def display_chat(prompt, text):
formatted_prompt = "<font size='+1' color='brown'>🙋♂️<blockquote>" + prompt + "</blockquote></font>"
text = text.replace('•', ' *')
text = textwrap.indent(text, '> ', predicate=lambda _: True)
formatted_text = "<font size='+1' color='teal'>🤖\n\n" + text + "\n</font>"
return Markdown(formatted_prompt+formatted_text)
def to_markdown(text):
text = text.replace('•', ' *')
return Markdown(textwrap.indent(text, '> ', predicate=lambda _: True))
चैटबॉट बनाना
Gemma के निर्देशों वाले मॉडल gemma2_instruct_2b_en
को इन टर्न टोकन को समझने के लिए ऑप्टिमाइज़ किया गया है:
<start_of_turn>user\n ... <end_of_turn>\n
<start_of_turn>model\n ... <end_of_turn>\n
इस ट्यूटोरियल में चैटबॉट बनाने के लिए इन टोकन का इस्तेमाल किया गया है. Gemma कंट्रोल टोकन के बारे में ज़्यादा जानने के लिए, फ़ॉर्मैटिंग और सिस्टम से जुड़े निर्देश देखें.
बातचीत की स्थिति मैनेज करने के लिए, चैट हेल्पर बनाएं
class ChatState():
"""
Manages the conversation history for a turn-based chatbot
Follows the turn-based conversation guidelines for the Gemma family of models
documented at https://ai.google.dev/gemma/docs/formatting
"""
__START_TURN_USER__ = "<start_of_turn>user\n"
__START_TURN_MODEL__ = "<start_of_turn>model\n"
__END_TURN__ = "<end_of_turn>\n"
def __init__(self, model, system=""):
"""
Initializes the chat state.
Args:
model: The language model to use for generating responses.
system: (Optional) System instructions or bot description.
"""
self.model = model
self.system = system
self.history = []
def add_to_history_as_user(self, message):
"""
Adds a user message to the history with start/end turn markers.
"""
self.history.append(self.__START_TURN_USER__ + message + self.__END_TURN__)
def add_to_history_as_model(self, message):
"""
Adds a model response to the history with start/end turn markers.
"""
self.history.append(self.__START_TURN_MODEL__ + message)
def get_history(self):
"""
Returns the entire chat history as a single string.
"""
return "".join([*self.history])
def get_full_prompt(self):
"""
Builds the prompt for the language model, including history and system description.
"""
prompt = self.get_history() + self.__START_TURN_MODEL__
if len(self.system)>0:
prompt = self.system + "\n" + prompt
return prompt
def send_message(self, message):
"""
Handles sending a user message and getting a model response.
Args:
message: The user's message.
Returns:
The model's response.
"""
self.add_to_history_as_user(message)
prompt = self.get_full_prompt()
response = self.model.generate(prompt, max_length=2048)
result = response.replace(prompt, "") # Extract only the new response
self.add_to_history_as_model(result)
return result
मॉडल के साथ चैट करें
मॉडल के साथ चैट करना शुरू करें.
chat = ChatState(gemma_lm)
message = "Tell me, in a few words, how to compute all prime numbers up to 1000?"
display_chat(message, chat.send_message(message))
🙋♂️
मुझे कुछ शब्दों में बताएं कि 1,000 तक की सभी प्राइम संख्याओं का हिसाब कैसे लगाएं?̋
एराटोस्थनीज़ की छनक.
बातचीत जारी रखें.
message = "Now in Python! No numpy, please!"
display_chat(message, chat.send_message(message))
🙋♂️
अब Python में! कृपया हमारी जानकारी दें, ताकि आप हमसे संपर्क न करें!🤖
def sieve_of_eratosthenes(n): """Returns a list of prime numbers up to n.""" primes = [True] * (n + 1) primes[0] = primes[1] = False for i in range(2, int(n**0.5) + 1): if primes[i]: for j in range(i * i, n + 1, i): primes[j] = False return [i for i, is_prime in enumerate(primes) if is_prime] primes = sieve_of_eratosthenes(1000) print(primes)
इसका मतलब है:
प्रोसेस शुरू करने का तरीका:
primes = [True] * (n + 1)
: यह मानते हुए कि सभी संख्याएं प्राइम हैं, बूलियन वैल्यू कीprimes
सूची बनाता है.primes[0] = primes[1] = False
: 0 और 1 को नॉन-प्राइम के तौर पर सेट करता है.इटरेशन:
for i in range(2, int(n**0.5) + 1):
: 2 सेn
के वर्गमूल तक फिर से बदलता है. हमें सिर्फ़ वर्गमूल की जांच करनी होगी क्योंकि किसी भी कंपोज़िट नंबर का प्राइम फ़ैक्टर, उसके स्क्वेयर रूट से कम या उसके बराबर होना चाहिए.if primes[i]:
: अगरi
को प्राइम के तौर पर मार्क किया गया है, तो:
for j in range(i * i, n + 1, i):
:i
के सभी गुणज को गैर-प्राइम के तौर पर मार्क करता है.नतीजा:
return [i for i, is_prime in enumerate(primes) if is_prime]
: ऐसे इंडेक्स की सूची बनाता है जिनमेंprimes[i]
'सही' है. यह प्राइम संख्याओं को दिखाता है.अगर आपको कॉन्टेंट के किसी भी हिस्से के बारे में ज़्यादा जानकारी चाहिए, तो हमें बताएं!
message = "Thank you, it works! Can you explain the code in French?"
display_chat(message, chat.send_message(message))
🙋♂️
धन्यवाद, यह सही तरीके से काम कर रहा है! क्या आप फ़्रेंच में कोड के बारे में जानकारी दे सकते हैं?🤖
बिएन सुर ! Voici une explication du code en français :
def sieve_of_eratosthenes(n): """Retourne une liste de nombres premiers jusqu'à n.""" primes = [True] * (n + 1) primes[0] = primes[1] = False for i in range(2, int(n**0.5) + 1): if primes[i]: for j in range(i * i, n + 1, i): primes[j] = False return [i for i, is_prime in enumerate(primes) if is_prime] primes = sieve_of_eratosthenes(1000) print(primes)
अनुमान:
प्रोसेस शुरू करने के चरण:
primes = [True] * (n + 1)
: Crée Une listeprimes
de valeurs booléennes, रोमांच, supposant que tous les nombres sont Premiers.primes[0] = primes[1] = False
: Définit 0 et 1 comme नॉन-प्रीमियर.दोहराव:
for i in range(2, int(n**0.5) + 1):
: Itère de 2 jussku'à la racine carrée den
. Nous ne devons vérifier que jusqu'à la racine carrée car tout nombre पुराना ज़रूरतों avoir unfacteur premier inférieur ou égal à sa racine canree.if primes[i]:
: Sii
est considéré comme Premier:
for j in range(i * i, n + 1, i):
: Marquer tous les Multis dei
, गैर-प्रीमियर फ़ॉर्मैट में दिखाए जाते हैं.नतीजे:
return [i for i, is_prime in enumerate(primes) if is_prime]
: Crée une liste des inindexes oùprimes[i]
est vrai, représentant les nombres premier.N'hésitez pas à me Demander si vous avez besoin d'une explication प्लस détaillée de quelque चुना गया!
message = "Great! Now add those explanations as comments in the code."
display_chat(message, chat.send_message(message))
🙋♂️
बढ़िया! अब उन एक्सप्लेनेशंस को कोड में टिप्पणियों के तौर पर जोड़ें.🤖
def sieve_of_eratosthenes(n): """Retourne une liste de nombres premiers jusqu'à n.""" # Initialise une liste de boolean avec True pour tous les nombres de 0 à n primes = [True] * (n + 1) # Définit 0 et 1 comme non-premiers primes[0] = primes[1] = False # Itère de 2 à la racine carrée de n for i in range(2, int(n**0.5) + 1): # Si i est considéré comme premier if primes[i]: # Itère sur tous les multiples de i for j in range(i * i, n + 1, i): # Définit les multiples de i comme non-premiers primes[j] = False # Retourne la liste des indices des nombres premiers return [i for i, is_prime in enumerate(primes) if is_prime] primes = sieve_of_eratosthenes(1000) print(primes)
अनुमान:
- प्रोसेस शुरू करने के चरण:
primes = [True] * (n + 1)
: Crée une listeprimes
de valeurs booléennes, इनीशियलमेंट supposant que tous les nombres sont Premiers.primes[0] = primes[1] = False
: Définit 0 et 1 comme नॉन-प्रीमियर.- दोहराव:
for i in range(2, int(n**0.5) + 1):
: Itère de 2 jussku'à la racine carrée den
. Nous ne devons vérifier que jusqu'à la racine carrée car tout nombre पुराना ज़रूरतों avoir unfacteur premier inférieur ou égal à sa racine canree.if primes[i]:
: Sii
est considéré comme Premier:
for j in range(i * i, n + 1, i):
: Marquer tous les Multis dei
, गैर-प्रीमियर फ़ॉर्मैट में दिखाए जाते हैं.- नतीजे:
return [i for i, is_prime in enumerate(primes) if is_prime]
: Crée une liste des inindexes oùprimes[i]
est vrai, représentant les nombres premier.
जनरेट किया गया कोड चलाकर, जनरेट किए गए रिस्पॉन्स की जांच करें:
def sieve_of_eratosthenes(n):
"""Retourne une liste de nombres premiers jusqu'à n."""
# Initialise une liste de boolean avec True pour tous les nombres de 0 à n
primes = [True] * (n + 1)
# Définit 0 et 1 comme non-premiers
primes[0] = primes[1] = False
# Itère de 2 à la racine carrée de n
for i in range(2, int(n**0.5) + 1):
# Si i est considéré comme premier
if primes[i]:
# Itère sur tous les multiples de i
for j in range(i * i, n + 1, i):
# Définit les multiples de i comme non-premiers
primes[j] = False
# Retourne la liste des indices des nombres premiers
return [i for i, is_prime in enumerate(primes) if is_prime]
primes = sieve_of_eratosthenes(1000)
print(primes)
[2, 3, 5, 7, 11, 13, 17, 19, 23, 29, 31, 37, 41, 43, 47, 53, 59, 61, 67, 71, 73, 79, 83, 89, 97, 101, 103, 107, 109, 113, 127, 131, 137, 139, 149, 151, 157, 163, 167, 173, 179, 181, 191, 193, 197, 199, 211, 223, 227, 229, 233, 239, 241, 251, 257, 263, 269, 271, 277, 281, 283, 293, 307, 311, 313, 317, 331, 337, 347, 349, 353, 359, 367, 373, 379, 383, 389, 397, 401, 409, 419, 421, 431, 433, 439, 443, 449, 457, 461, 463, 467, 479, 487, 491, 499, 503, 509, 521, 523, 541, 547, 557, 563, 569, 571, 577, 587, 593, 599, 601, 607, 613, 617, 619, 631, 641, 643, 647, 653, 659, 661, 673, 677, 683, 691, 701, 709, 719, 727, 733, 739, 743, 751, 757, 761, 769, 773, 787, 797, 809, 811, 821, 823, 827, 829, 839, 853, 857, 859, 863, 877, 881, 883, 887, 907, 911, 919, 929, 937, 941, 947, 953, 967, 971, 977, 983, 991, 997]
get_history
तरीके का इस्तेमाल करके देखें कि Chat
क्लास ने पूरे कॉन्टेक्स्ट को कैसे बनाए रखा है.
print(chat.get_history())
<start_of_turn>user Tell me, in a few words, how to compute all prime numbers up to 1000?<end_of_turn> <start_of_turn>model **Sieve of Eratosthenes.** <end_of_turn><start_of_turn>user Now in Python! No numpy, please!<end_of_turn> <start_of_turn>model ```python def sieve_of_eratosthenes(n): """Returns a list of prime numbers up to n.""" primes = [True] * (n + 1) primes[0] = primes[1] = False for i in range(2, int(n**0.5) + 1): if primes[i]: for j in range(i * i, n + 1, i): primes[j] = False return [i for i, is_prime in enumerate(primes) if is_prime] primes = sieve_of_eratosthenes(1000) print(primes) ``` **Explanation:** 1. **Initialization:** - `primes = [True] * (n + 1)`: Creates a list `primes` of boolean values, initially assuming all numbers are prime. - `primes[0] = primes[1] = False`: Sets 0 and 1 as non-prime. 2. **Iteration:** - `for i in range(2, int(n**0.5) + 1):`: Iterates from 2 to the square root of `n`. We only need to check up to the square root because any composite number must have a prime factor less than or equal to its square root. - `if primes[i]:`: If `i` is marked as prime: - `for j in range(i * i, n + 1, i):`: Marks all multiples of `i` as non-prime. 3. **Result:** - `return [i for i, is_prime in enumerate(primes) if is_prime]`: Creates a list of indices where `primes[i]` is True, representing the prime numbers. Let me know if you'd like a more detailed explanation of any part! <end_of_turn><start_of_turn>user Thank you, it works! Can you explain the code in French?<end_of_turn> <start_of_turn>model Bien sûr ! Voici une explication du code en français : ```python def sieve_of_eratosthenes(n): """Retourne une liste de nombres premiers jusqu'à n.""" primes = [True] * (n + 1) primes[0] = primes[1] = False for i in range(2, int(n**0.5) + 1): if primes[i]: for j in range(i * i, n + 1, i): primes[j] = False return [i for i, is_prime in enumerate(primes) if is_prime] primes = sieve_of_eratosthenes(1000) print(primes) ``` **Explication:** 1. **Initialisation:** - `primes = [True] * (n + 1)`: Crée une liste `primes` de valeurs booléennes, initialement supposant que tous les nombres sont premiers. - `primes[0] = primes[1] = False`: Définit 0 et 1 comme non-premiers. 2. **Itération:** - `for i in range(2, int(n**0.5) + 1):`: Itère de 2 jusqu'à la racine carrée de `n`. Nous ne devons vérifier que jusqu'à la racine carrée car tout nombre composite doit avoir un facteur premier inférieur ou égal à sa racine carrée. - `if primes[i]:`: Si `i` est considéré comme premier: - `for j in range(i * i, n + 1, i):`: Marquer tous les multiples de `i` comme non-premiers. 3. **Resultat:** - `return [i for i, is_prime in enumerate(primes) if is_prime]`: Crée une liste des indices où `primes[i]` est vrai, représentant les nombres premiers. N'hésitez pas à me demander si vous avez besoin d'une explication plus détaillée de quelque chose! <end_of_turn><start_of_turn>user Great! Now add those explanations as comments in the code.<end_of_turn> <start_of_turn>model ```python def sieve_of_eratosthenes(n): """Retourne une liste de nombres premiers jusqu'à n.""" # Initialise une liste de boolean avec True pour tous les nombres de 0 à n primes = [True] * (n + 1) # Définit 0 et 1 comme non-premiers primes[0] = primes[1] = False # Itère de 2 à la racine carrée de n for i in range(2, int(n**0.5) + 1): # Si i est considéré comme premier if primes[i]: # Itère sur tous les multiples de i for j in range(i * i, n + 1, i): # Définit les multiples de i comme non-premiers primes[j] = False # Retourne la liste des indices des nombres premiers return [i for i, is_prime in enumerate(primes) if is_prime] primes = sieve_of_eratosthenes(1000) print(primes) ``` **Explication:** * **Initialisation:** * `primes = [True] * (n + 1)`: Crée une liste `primes` de valeurs booléennes, initialement supposant que tous les nombres sont premiers. * `primes[0] = primes[1] = False`: Définit 0 et 1 comme non-premiers. * **Itération:** * `for i in range(2, int(n**0.5) + 1):`: Itère de 2 jusqu'à la racine carrée de `n`. Nous ne devons vérifier que jusqu'à la racine carrée car tout nombre composite doit avoir un facteur premier inférieur ou égal à sa racine carrée. * `if primes[i]:`: Si `i` est considéré comme premier: * `for j in range(i * i, n + 1, i):`: Marquer tous les multiples de `i` comme non-premiers. * **Resultat:** * `return [i for i, is_prime in enumerate(primes) if is_prime]`: Crée une liste des indices où `primes[i]` est vrai, représentant les nombres premiers. <end_of_turn>
खास जानकारी और आगे का लेख
इस ट्यूटोरियल में, आपने JAX पर Keras का इस्तेमाल करके Gemma 2B निर्देश ट्यून किया गया मॉडल से चैट करने का तरीका सीखा.
जेमा के बारे में ज़्यादा जानने के लिए, ये गाइड और ट्यूटोरियल देखें:
- Keras Gemma का इस्तेमाल शुरू करें.
- Gemma मॉडल को जीपीयू पर बेहतर बनाएं.
- Vertex AI के साथ Gemma के इंटिग्रेशन के बारे में जानें
- Vertex AI की मदद से, Gemma के मॉडल इस्तेमाल करने का तरीका जानें.