KerasNLP를 사용하여 Gemma 시작하기

이 튜토리얼에서는 KerasNLP를 사용하여 Gemma를 시작하는 방법을 보여줍니다. Gemma는 Gemini 모델을 만드는 데 사용된 것과 동일한 연구 및 기술로 빌드된 최첨단 경량 개방형 모델군입니다. KerasNLP는 Keras에서 구현되고 JAX, PyTorch, TensorFlow에서 실행할 수 있는 자연어 처리 (NLP) 모델 모음입니다.

이 튜토리얼에서는 Gemma를 사용하여 여러 프롬프트에 대한 텍스트 응답을 생성합니다. Keras를 처음 사용하는 경우 시작하기 전에 Keras 시작하기를 읽어보는 것이 좋지만 필수는 아닙니다. 이 튜토리얼을 진행하면서 Keras에 대해 자세히 알아봅니다.


Gemma 설정

이 튜토리얼을 완료하려면 먼저 Gemma 설정에서 설정 안내를 완료해야 합니다. Gemma 설정 안내에서는 다음을 수행하는 방법을 보여줍니다.

  • kaggle.com에서 Gemma에 액세스합니다.
  • Gemma 2B 모델을 실행하는 데 충분한 리소스가 있는 Colab 런타임을 선택합니다.
  • Kaggle 사용자 이름과 API 키를 생성하고 구성합니다.

Gemma 설정을 완료한 후 다음 섹션으로 이동하여 Colab 환경의 환경 변수를 설정합니다.

환경 변수 설정하기


import os
from google.colab import userdata

# Note: `userdata.get` is a Colab API. If you're not using Colab, set the env
# vars as appropriate for your system.
os.environ["KAGGLE_USERNAME"] = userdata.get('KAGGLE_USERNAME')
os.environ["KAGGLE_KEY"] = userdata.get('KAGGLE_KEY')

종속 항목 설치

Keras 및 KerasNLP를 설치합니다.

# Install Keras 3 last. See for more details.
pip install -q -U keras-nlp
pip install -q -U "keras>=3"

백엔드 선택

Keras는 단순성과 사용 편의성을 위해 설계된 고급 멀티 프레임워크 딥 러닝 API입니다. Keras 3를 사용하면 TensorFlow, JAX, PyTorch 중에서 백엔드를 선택할 수 있습니다. 이 튜토리얼에서는 세 가지 방법 모두 사용할 수 있습니다.

import os

os.environ["KERAS_BACKEND"] = "jax"  # Or "tensorflow" or "torch".
os.environ["XLA_PYTHON_CLIENT_MEM_FRACTION"] = "0.9"

패키지 가져오기

Keras 및 KerasNLP를 가져옵니다.

import keras
import keras_nlp

모델 만들기

KerasNLP는 많이 사용되는 여러 모델 아키텍처의 구현을 제공합니다. 이 튜토리얼에서는 인과 언어 모델링을 위한 엔드 투 엔드 Gemma 모델인 GemmaCausalLM를 사용하여 모델을 만듭니다. 인과 언어 모델은 이전 토큰을 기반으로 다음 토큰을 예측합니다.

from_preset 메서드를 사용하여 모델을 만듭니다.

gemma_lm = keras_nlp.models.GemmaCausalLM.from_preset("gemma2_2b_en")

GemmaCausalLM.from_preset() 함수는 사전 설정된 아키텍처와 가중치에서 모델을 인스턴스화합니다. 위 코드에서 문자열 "gemma2_2b_en"는 20억 개의 매개변수가 있는 Gemma 2 2B 모델의 사전 설정을 지정합니다. 7B, 9B, 27B 매개변수가 있는 Gemma 모델도 사용할 수 있습니다. Gemma 모델의 코드 문자열은 Kaggle모델 변형 목록에서 확인할 수 있습니다.

summary를 사용하여 모델에 관한 자세한 정보를 가져옵니다.


요약에서 볼 수 있듯이 이 모델에는 학습 가능한 매개변수가 26억 개 있습니다.

텍스트 생성

이제 텍스트를 생성해 보겠습니다. 모델에는 프롬프트를 기반으로 텍스트를 생성하는 generate 메서드가 있습니다. 선택적 max_length 인수는 생성된 시퀀스의 최대 길이를 지정합니다.

"what is keras in 3 bullet points?" 프롬프트로 사용해 보세요.

gemma_lm.generate("what is keras in 3 bullet points?", max_length=64)
'what is keras in 3 bullet points?\n\n[Answer 1]\n\nKeras is a high-level neural networks API, written in Python and capable of running on top of TensorFlow, CNTK, Theano, or PlaidML. It is designed to be user-friendly and easy to extend.\n\n'

다른 프롬프트로 generate님께 다시 전화를 걸어 보세요.

gemma_lm.generate("The universe is", max_length=64)
'The universe is a vast and mysterious place, filled with countless stars, planets, and galaxies. But what if there was a way to see the universe in a whole new way? What if we could see the universe as it was when it was first created? What if we could see the universe as it is now'

JAX 또는 TensorFlow 백엔드에서 실행하는 경우 두 번째 generate 호출이 거의 즉시 반환됩니다. 이는 지정된 배치 크기 및 max_length의 각 generate 호출이 XLA로 컴파일되기 때문입니다. 첫 실행은 비용이 많이 들지만 이후 실행은 훨씬 빠릅니다.

목록을 입력으로 사용하여 일괄 프롬프트를 제공할 수도 있습니다.

    ["what is keras in 3 bullet points?",
     "The universe is"],
['what is keras in 3 bullet points?\n\n[Answer 1]\n\nKeras is a high-level neural networks API, written in Python and capable of running on top of TensorFlow, CNTK, Theano, or PlaidML. It is designed to be user-friendly and easy to extend.\n\n',
 'The universe is a vast and mysterious place, filled with countless stars, planets, and galaxies. But what if there was a way to see the universe in a whole new way? What if we could see the universe as it was when it was first created? What if we could see the universe as it is now']

선택사항: 다른 샘플러 사용해 보기

compile()에서 sampler 인수를 설정하여 GemmaCausalLM의 생성 전략을 제어할 수 있습니다. 기본적으로 "greedy" 샘플링이 사용됩니다.

실험으로 "top_k" 전략을 설정해 보세요.

gemma_lm.generate("The universe is", max_length=64)
'The universe is a big place, and there are so many things we do not know or understand about it.\n\nBut we can learn a lot about our world by studying what is known to us.\n\nFor example, if you look at the moon, it has many features that can be seen from the surface.'

기본 그리디 알고리즘은 항상 확률이 가장 높은 토큰을 선택하지만, Top-K 알고리즘은 확률이 가장 높은 K개의 토큰 중에서 다음 토큰을 무작위로 선택합니다.

샘플러를 지정할 필요는 없으며, 사용 사례에 도움이 되지 않는 경우 마지막 코드 스니펫을 무시할 수 있습니다. 사용 가능한 샘플러에 대해 자세히 알아보려면 샘플러를 참고하세요.

다음 단계

이 튜토리얼에서는 KerasNLP 및 Gemma를 사용하여 텍스트를 생성하는 방법을 알아봤습니다. 다음으로 학습할 주제에 대한 몇 가지 제안사항은 다음과 같습니다.