Bu eğitimde, Google AI Go SDK'sını kullanarak Go uygulamanız için Gemini API'ye nasıl erişileceği gösterilmektedir.
Bu eğitimde aşağıdakileri nasıl yapacağınızı öğreneceksiniz:
- API anahtarınız dahil projenizi ayarlama
- Yalnızca metin girişinden metin oluşturma
- Metin ve resim girişlerinden metin oluşturma (çok modlu)
- Farklı noktaları içeren görüşmeler (sohbet) oluşturma
- Daha hızlı etkileşimler için akışı kullanma
Ayrıca bu eğitim, gelişmiş kullanım alanları (ör. yerleştirme ve sayma jetonları) ve içerik oluşturmayı kontrol etme ile ilgili bölümler de içerir.
Ön koşullar
Bu eğiticide, Go ile uygulama oluşturma konusunda bilgi sahibi olduğunuz varsayılır.
Bu eğiticiyi tamamlamak için geliştirme ortamınızın aşağıdaki gereksinimleri karşıladığından emin olun:
- 1.20 ve üzeri sürümler
Projenizi oluşturun
Gemini API'yi çağırmadan önce projenizi ayarlamanız gerekir. Bu kapsamda, API anahtarınızı oluşturma, SDK paketini yükleme ve modeli başlatma adımları yer alır.
API anahtarınızı oluşturma
Gemini API'yi kullanmak için API anahtarına ihtiyacınız vardır. Henüz yoksa Google AI Studio'da bir anahtar oluşturun.
API anahtarınızın güvenliğini sağlayın
Sürüm kontrol sisteminizde bir API anahtarını kontrol etmemeniz kesinlikle önerilir. Bunun yerine, API anahtarınız için bir gizli anahtar deposu kullanmanız gerekir.
Bu eğitimdeki tüm snippet'ler, API anahtarınıza bir ortam değişkeni olarak eriştiğiniz varsayılır.
SDK paketini yükleyin
Gemini API'yi kendi uygulamanızda kullanmak için modül dizininizde Go SDK paketini get
olarak ayarlamanız gerekir:
go get github.com/google/generative-ai-go
Üretken modeli başlatma
API çağrısı yapabilmek için üretken modeli içe aktarıp ilk kullanıma hazırlamanız gerekir.
import "github.com/google/generative-ai-go/genai"
import "google.golang.org/api/option"
ctx := context.Background()
// Access your API key as an environment variable (see "Set up your API key" above)
client, err := genai.NewClient(ctx, option.WithAPIKey(os.Getenv("API_KEY")))
if err != nil {
log.Fatal(err)
}
defer client.Close()
// The Gemini 1.5 models are versatile and work with most use cases
model := client.GenerativeModel("gemini-1.5-flash")
Bir model belirtirken aşağıdakilere dikkat edin:
Kullanım alanınıza özel bir model kullanın (örneğin,
gemini-1.5-flash
çok modlu giriş içindir). Bu kılavuzda, her uygulamaya ait talimatlarda her kullanım alanı için önerilen modeller listelenmiştir.
Yaygın kullanım alanlarını hayata geçirin
Artık projeniz hazır olduğuna göre Gemini API'yi kullanarak farklı kullanım alanları uygulayabilirsiniz:
- Yalnızca metin girişinden metin oluşturma
- Metin ve resim girişlerinden metin oluşturma (çok modlu)
- Farklı noktaları içeren görüşmeler (sohbet) oluşturma
- Daha hızlı etkileşimler için akışı kullanma
Gelişmiş kullanım alanları bölümünde Gemini API ve yerleştirmeler hakkında bilgi edinebilirsiniz.
Yalnızca metin girişinden metin oluştur
İstem girişi yalnızca metin içeriyorsa metin çıkışı oluşturmak için Gemini 1.5 modelini veya generateContent
özelliğine sahip Gemini 1.0 Pro modelini kullanın:
ctx := context.Background()
// Access your API key as an environment variable (see "Set up your API key" above)
client, err := genai.NewClient(ctx, option.WithAPIKey(os.Getenv("API_KEY")))
if err != nil {
log.Fatal(err)
}
defer client.Close()
// The Gemini 1.5 models are versatile and work with both text-only and multimodal prompts
model := client.GenerativeModel("gemini-1.5-flash")
resp, err := model.GenerateContent(ctx, genai.Text("Write a story about a magic backpack."))
if err != nil {
log.Fatal(err)
}
Metin ve resim girişlerinden metin oluşturma (çok modlu)
Gemini, hem metin hem de resim girebilmeniz için çok modlu girişleri (Gemini 1.5 modelleri) işleyebilen çeşitli modeller sunar. İstemler için resim şartlarını incelemeyi unutmayın.
İstem girişi hem metin hem de resim içerdiğinde metin çıkışı oluşturmak için generateContent
yöntemiyle Gemini 1.5 modelini kullanın:
ctx := context.Background()
// Access your API key as an environment variable (see "Set up your API key" above)
client, err := genai.NewClient(ctx, option.WithAPIKey(os.Getenv("API_KEY")))
if err != nil {
log.Fatal(err)
}
defer client.Close()
// The Gemini 1.5 models are versatile and work with both text-only and multimodal prompts
model := client.GenerativeModel("gemini-1.5-flash")
imgData1, err := os.ReadFile(pathToImage1)
if err != nil {
log.Fatal(err)
}
imgData2, err := os.ReadFile(pathToImage1)
if err != nil {
log.Fatal(err)
}
prompt := []genai.Part{
genai.ImageData("jpeg", imgData1),
genai.ImageData("jpeg", imgData2),
genai.Text("What's different between these two pictures?"),
}
resp, err := model.GenerateContent(ctx, prompt...)
if err != nil {
log.Fatal(err)
}
Çok dönüşlü görüşmeler (sohbet) oluşturun
Gemini'ı kullanarak birden fazla turne arasında serbest biçimli sohbetler gerçekleştirebilirsiniz. SDK, görüşmenin durumunu yöneterek süreci basitleştirir. Bu sayede, GenerateContent
uygulamasının aksine, görüşme geçmişini sizin saklamanız gerekmez.
Çok dönüşlü bir sohbet (ör. sohbet) başlatmak için Gemini 1.5 veya Gemini 1.0 Pro modelini kullanın. Ardından, startChat()
numaralı telefonu arayarak sohbeti başlatın.
Ardından, yeni kullanıcı mesajı göndermek için sendMessage()
öğesini kullanın. Bu mesaj, mesajı ve yanıtı da sohbet geçmişine ekler.
Bir görüşmedeki içerikle ilişkili role
için iki olası seçenek vardır:
user
: İstemleri sağlayan roldür. Bu değer,SendMessage
çağrıları için varsayılan değerdir.model
: yanıtları sağlayan rol. Bu rol, mevcuthistory
ileStartChat()
çağrısı yapılırken kullanılabilir.
ctx := context.Background()
// Access your API key as an environment variable (see "Set up your API key" above)
client, err := genai.NewClient(ctx, option.WithAPIKey(os.Getenv("API_KEY")))
if err != nil {
log.Fatal(err)
}
defer client.Close()
// The Gemini 1.5 models are versatile and work with multi-turn conversations (like chat)
model := client.GenerativeModel("gemini-1.5-flash")
// Initialize the chat
cs := model.StartChat()
cs.History = []*genai.Content{
&genai.Content{
Parts: []genai.Part{
genai.Text("Hello, I have 2 dogs in my house."),
},
Role: "user",
},
&genai.Content{
Parts: []genai.Part{
genai.Text("Great to meet you. What would you like to know?"),
},
Role: "model",
},
}
resp, err := cs.SendMessage(ctx, genai.Text("How many paws are in my house?"))
if err != nil {
log.Fatal(err)
}
Daha hızlı etkileşimler için akışı kullanın
Varsayılan olarak model, oluşturma sürecinin tamamını tamamladıktan sonra yanıt döndürür. Sonucun tamamını beklemeden, bunun yerine kısmi sonuçları işlemek için akışı kullanarak daha hızlı etkileşimler gerçekleştirebilirsiniz.
Aşağıdaki örnekte, metin ve resim giriş isteminden metin oluşturmak için GenerateContentStream
yöntemiyle akışın nasıl uygulanacağı gösterilmektedir.
ctx := context.Background()
// Access your API key as an environment variable (see "Set up your API key" above)
client, err := genai.NewClient(ctx, option.WithAPIKey(os.Getenv("API_KEY")))
if err != nil {
log.Fatal(err)
}
defer client.Close()
// The Gemini 1.5 models are versatile and work with both text-only and multimodal prompts
model := client.GenerativeModel("gemini-1.5-flash")
imageBytes, err := os.ReadFile(pathToImage)
img := genai.ImageData("jpeg", imageBytes)
prompt := genai.Text("Tell me a story about this animal")
iter := model.GenerateContentStream(ctx, img, prompt)
for {
resp, err := iter.Next()
if err == iterator.Done {
break
}
if err != nil {
log.Fatal(err)
}
// ... print resp
}
Yalnızca metin girişi ve sohbet kullanım alanları için de benzer bir yaklaşım kullanabilirsiniz.
prompt := genai.Text("Tell me a story about a lumberjack and his giant ox")
iter := model.GenerateContentStream(ctx, prompt)
prompt := genai.Text("And how do you feel about that?")
iter := cs.SendMessageStream(ctx, prompt)
Gelişmiş kullanım alanları uygulayın
Bu eğiticinin önceki bölümünde açıklanan yaygın kullanım alanları, Gemini API'yi rahatça kullanmanıza yardımcı olur. Bu bölümde, daha gelişmiş olarak değerlendirilebilecek bazı kullanım alanları açıklanmaktadır.
Yerleştirmeleri kullanma
Yerleştirme, bilgileri bir dizideki kayan nokta sayılarının listesi olarak sunmak için kullanılan bir tekniktir. Gemini ile metinleri (kelimeler, cümleler ve metin blokları) vektörleştirilmiş biçimde temsil edebilirsiniz. Böylece yerleştirmeleri kolayca karşılaştırabilir ve ayırt edebilirsiniz. Örneğin, benzer bir konuyu veya düşünceyi paylaşan iki metin, benzer yerleştirmelere sahip olmalıdır. Bu yerleştirmeler, kosinüs benzerliği gibi matematiksel karşılaştırma teknikleriyle tanımlanabilir.
Yerleştirme oluşturmak için EmbedContent
yöntemiyle (veya BatchEmbedContent
yöntemiyle) embedding-001
modelini kullanın. Aşağıdaki örnek, tek bir dize için bir yerleştirme oluşturur:
ctx := context.Background()
// Access your API key as an environment variable (see "Set up your API key" above)
client, err := genai.NewClient(ctx, option.WithAPIKey(os.Getenv("API_KEY")))
if err != nil {
log.Fatal(err)
}
defer client.Close()
// For embeddings, use the embedding-001 model
em := client.EmbeddingModel("embedding-001")
res, err := em.EmbedContent(ctx, genai.Text("The quick brown fox jumps over the lazy dog."))
if err != nil {
panic(err)
}
fmt.Println(res.Embedding.Values)
İşlev çağırma
İşlev çağrısı, üretken modellerden yapılandırılmış veri çıkışları almanızı kolaylaştırır. Daha sonra bu çıkışları kullanarak diğer API'leri çağırabilir ve ilgili yanıt verilerini modele döndürebilirsiniz. Başka bir deyişle, işlev çağrısı, üretken modelleri harici sistemlere bağlamanıza yardımcı olur. Böylece, oluşturulan içerik en güncel ve doğru bilgileri içerir. İşlev çağrısı eğiticisinden daha fazla bilgi edinebilirsiniz.
Jetonları say
Uzun istemler kullanırken, modele herhangi bir içerik göndermeden önce jetonları saymak faydalı olabilir. Aşağıdaki örnekler, çeşitli kullanım alanları için CountTokens()
hizmetinin nasıl kullanılacağını gösterir:
// For text-only input
text := "Parrots can be green and live a long time."
resp, err := model.CountTokens(ctx, genai.Text(text))
if err != nil {
log.Fatal(err)
}
fmt.Println(resp.TotalTokens)
// For text-and-image input (multimodal)
text := "Parrots can be green and live a long time."
imageBytes, err := os.ReadFile(pathToImage)
if err != nil {
log.Fatal(err)
}
resp, err := model.CountTokens(
ctx,
genai.Text(text),
genai.ImageData("png", imageBytes))
if err != nil {
log.Fatal(err)
}
fmt.Println(resp.TotalTokens)
İçerik oluşturmayı kontrol etme seçenekleri
Model parametrelerini yapılandırarak ve güvenlik ayarlarını kullanarak içerik oluşturmayı kontrol edebilirsiniz.
Model parametrelerini yapılandırma
Modele gönderdiğiniz her istem, modelin yanıt oluşturma şeklini kontrol eden parametre değerleri içerir. Model, farklı parametre değerleri için farklı sonuçlar oluşturabilir. Model parametreleri hakkında daha fazla bilgi edinin. Yapılandırma, model örneğinizin kullanım ömrü boyunca korunur.
// ...
// The Gemini 1.5 models are versatile and work with most use cases
model := client.GenerativeModel("gemini-1.5-flash")
// Configure model parameters by invoking Set* methods on the model.
model.SetTemperature(0.9)
model.SetTopK(1)
// ...
Güvenlik ayarlarını kullan
Zararlı olarak değerlendirilebilecek yanıtlar alma olasılığını ayarlamak için güvenlik ayarlarını kullanabilirsiniz. Varsayılan olarak güvenlik ayarları, güvenli olmayan içerik olma olasılığı orta ve yüksek olasılıklı içerikleri tüm boyutlarda engeller. Güvenlik ayarları hakkında daha fazla bilgi edinin.
Aşağıda, bir güvenlik ayarını nasıl yapacağınız açıklanmaktadır:
// ...
// The Gemini 1.5 models are versatile and work with most use cases
model := client.GenerativeModel("gemini-1.5-flash")
model.SafetySettings = []*genai.SafetySetting{
{
Category: genai.HarmCategoryHarassment,
Threshold: genai.HarmBlockOnlyHigh,
},
}
// ...
Ayrıca, birden fazla güvenlik ayarı da belirleyebilirsiniz:
// ...
// The Gemini 1.5 models are versatile and work with most use cases
model := client.GenerativeModel("gemini-1.5-flash")
model.SafetySettings = []*genai.SafetySetting{
{
Category: genai.HarmCategoryHarassment,
Threshold: genai.HarmBlockOnlyHigh,
},
{
Category: genai.HarmCategoryHateSpeech,
Threshold: genai.HarmBlockMediumAndAbove,
},
}
// ...
Sırada ne var?
İstem tasarımı, dil modellerinden istenen yanıtı üreten istem oluşturma sürecidir. İyi yapılandırılmış istemler yazmak, bir dil modelinden doğru ve yüksek kaliteli yanıtlar almanın önemli bir parçasıdır. İstem yazmayla ilgili en iyi uygulamalar hakkında bilgi edinin.
Gemini; giriş türleri ve karmaşıklığı, sohbet veya diğer iletişim dili görevlerine yönelik uygulamalar ve boyut kısıtlamaları gibi farklı kullanım alanlarının ihtiyaçlarını karşılamak için çeşitli model varyasyonları sunar. Mevcut Gemini modelleri hakkında bilgi edinin.