এই টিউটোরিয়ালটি Google AI ডার্ট SDK ব্যবহার করে কীভাবে আপনার ডার্ট বা ফ্লাটার অ্যাপ্লিকেশনের জন্য Gemini API অ্যাক্সেস করতে হয় তা প্রদর্শন করে। আপনি যদি আপনার অ্যাপে জেমিনি মডেল অ্যাক্সেস করার জন্য REST API-এর সাথে সরাসরি কাজ করতে না চান তাহলে আপনি এই SDK ব্যবহার করতে পারেন।
এই টিউটোরিয়ালে, আপনি নিম্নলিখিতগুলি কীভাবে করবেন তা শিখবেন:
- আপনার API কী সহ আপনার প্রকল্প সেট আপ করুন
- শুধুমাত্র পাঠ্য ইনপুট থেকে পাঠ্য তৈরি করুন
- টেক্সট-এবং-ইমেজ ইনপুট (মাল্টিমোডাল) থেকে পাঠ্য তৈরি করুন
- মাল্টি-টার্ন কথোপকথন তৈরি করুন (চ্যাট)
- দ্রুত মিথস্ক্রিয়া জন্য স্ট্রিমিং ব্যবহার করুন
এছাড়াও, এই টিউটোরিয়ালটিতে উন্নত ব্যবহারের ক্ষেত্রে (যেমন এম্বেডিং এবং গণনা টোকেন ) এবং সেইসাথে বিষয়বস্তু তৈরি নিয়ন্ত্রণের বিকল্পগুলি রয়েছে।
পূর্বশর্ত
এই টিউটোরিয়ালটি ধরে নেয় যে আপনি ডার্টের সাথে অ্যাপ্লিকেশন তৈরি করার সাথে পরিচিত।
এই টিউটোরিয়ালটি সম্পূর্ণ করতে, নিশ্চিত করুন যে আপনার উন্নয়ন পরিবেশ নিম্নলিখিত প্রয়োজনীয়তাগুলি পূরণ করে:
- ডার্ট 3.2.0+
আপনার প্রকল্প সেট আপ করুন
Gemini API কল করার আগে, আপনাকে আপনার প্রকল্প সেট আপ করতে হবে, যার মধ্যে আপনার API কী সেট আপ করা, আপনার পাব নির্ভরতায় SDK যোগ করা এবং মডেলটি শুরু করা অন্তর্ভুক্ত।
আপনার API কী সেট আপ করুন
Gemini API ব্যবহার করতে, আপনার একটি API কী প্রয়োজন। আপনার যদি ইতিমধ্যে একটি না থাকে তবে Google AI স্টুডিওতে একটি কী তৈরি করুন৷
আপনার API কী সুরক্ষিত করুন
আপনার API কী সুরক্ষিত রাখুন। আমরা দৃঢ়ভাবে সুপারিশ করছি যে আপনি সরাসরি আপনার কোডে API কী অন্তর্ভুক্ত করবেন না বা সংস্করণ নিয়ন্ত্রণ সিস্টেমে কী রয়েছে এমন ফাইলগুলি পরীক্ষা করুন৷ পরিবর্তে, আপনার API কী এর জন্য একটি গোপন স্টোর ব্যবহার করা উচিত।
এই টিউটোরিয়ালের সমস্ত স্নিপেট অনুমান করে যে আপনি একটি প্রক্রিয়া পরিবেশ পরিবর্তনশীল হিসাবে আপনার API কী অ্যাক্সেস করছেন। আপনি যদি একটি Flutter অ্যাপ তৈরি করেন, তাহলে আপনি String.fromEnvironment
ব্যবহার করতে পারেন এবং এপিআই কী দিয়ে কম্পাইল করতে flutter build
করতে --dart-define=API_KEY=$API_KEY
পাস flutter run
পারেন কারণ অ্যাপটি চালানোর সময় প্রক্রিয়া পরিবেশ ভিন্ন হবে। .
SDK প্যাকেজ ইনস্টল করুন
আপনার নিজের অ্যাপ্লিকেশনে Gemini API ব্যবহার করতে, আপনাকে আপনার ডার্ট বা ফ্লাটার অ্যাপে google_generative_ai
প্যাকেজ add
হবে:
ডার্ট
dart pub add google_generative_ai
ফ্লাটার
flutter pub add google_generative_ai
জেনারেটিভ মডেল শুরু করুন
আপনি যেকোন API কল করার আগে, আপনাকে জেনারেটিভ মডেলটি আমদানি এবং আরম্ভ করতে হবে।
import 'dart:io';
import 'package:google_generative_ai/google_generative_ai.dart';
void main() async {
// Access your API key as an environment variable (see "Set up your API key" above)
final apiKey = Platform.environment['API_KEY'];
if (apiKey == null) {
print('No \$API_KEY environment variable');
exit(1);
}
// The Gemini 1.5 models are versatile and work with most use cases
final model = GenerativeModel(model: 'gemini-1.5-flash', apiKey: apiKey);
}
একটি মডেল নির্দিষ্ট করার সময়, নিম্নলিখিত নোট করুন:
আপনার ব্যবহারের ক্ষেত্রে নির্দিষ্ট একটি মডেল ব্যবহার করুন (উদাহরণস্বরূপ,
gemini-1.5-flash
মাল্টিমোডাল ইনপুটের জন্য)। এই গাইডের মধ্যে, প্রতিটি বাস্তবায়নের নির্দেশাবলী প্রতিটি ব্যবহারের ক্ষেত্রে প্রস্তাবিত মডেলের তালিকা করে।
সাধারণ ব্যবহারের ক্ষেত্রে প্রয়োগ করুন
এখন আপনার প্রকল্প সেট আপ করা হয়েছে, আপনি বিভিন্ন ব্যবহারের ক্ষেত্রে প্রয়োগ করতে Gemini API ব্যবহার করে অন্বেষণ করতে পারেন:
- শুধুমাত্র পাঠ্য ইনপুট থেকে পাঠ্য তৈরি করুন
- টেক্সট-এবং-ইমেজ ইনপুট (মাল্টিমোডাল) থেকে পাঠ্য তৈরি করুন
- মাল্টি-টার্ন কথোপকথন তৈরি করুন (চ্যাট)
- দ্রুত মিথস্ক্রিয়া জন্য স্ট্রিমিং ব্যবহার করুন
উন্নত ব্যবহারের ক্ষেত্রে বিভাগে, আপনি Gemini API এবং এম্বেডিং সম্পর্কে তথ্য পেতে পারেন।
শুধুমাত্র পাঠ্য ইনপুট থেকে পাঠ্য তৈরি করুন
যখন প্রম্পট ইনপুটে শুধুমাত্র টেক্সট অন্তর্ভুক্ত থাকে, তখন টেক্সট আউটপুট জেনারেট generateContent
Gemini 1.5 মডেল বা Gemini 1.0 Pro মডেল ব্যবহার করুন:
import 'dart:io';
import 'package:google_generative_ai/google_generative_ai.dart';
void main() async {
// Access your API key as an environment variable (see "Set up your API key" above)
final apiKey = Platform.environment['API_KEY'];
if (apiKey == null) {
print('No \$API_KEY environment variable');
exit(1);
}
// The Gemini 1.5 models are versatile and work with both text-only and multimodal prompts
final model = GenerativeModel(model: 'gemini-1.5-flash', apiKey: apiKey);
final content = [Content.text('Write a story about a magic backpack.')];
final response = await model.generateContent(content);
print(response.text);
}
টেক্সট-এবং-ইমেজ ইনপুট (মাল্টিমোডাল) থেকে পাঠ্য তৈরি করুন
জেমিনি বিভিন্ন মডেল সরবরাহ করে যা মাল্টিমোডাল ইনপুট (জেমিনি 1.5 মডেল) পরিচালনা করতে পারে যাতে আপনি পাঠ্য এবং চিত্র উভয়ই ইনপুট করতে পারেন। প্রম্পটের জন্য চিত্রের প্রয়োজনীয়তাগুলি পর্যালোচনা করতে ভুলবেন না।
যখন প্রম্পট ইনপুট টেক্সট এবং ইমেজ উভয়ই অন্তর্ভুক্ত করে, তখন টেক্সট আউটপুট তৈরি করতে generateContent
পদ্ধতি সহ একটি Gemini 1.5 মডেল ব্যবহার করুন:
import 'dart:io';
import 'package:google_generative_ai/google_generative_ai.dart';
void main() async {
// Access your API key as an environment variable (see "Set up your API key" above)
final apiKey = Platform.environment['API_KEY'];
if (apiKey == null) {
print('No \$API_KEY environment variable');
exit(1);
}
// The Gemini 1.5 models are versatile and work with both text-only and multimodal prompts
final model = GenerativeModel(model: 'gemini-1.5-flash', apiKey: apiKey);
final (firstImage, secondImage) = await (
File('image0.jpg').readAsBytes(),
File('image1.jpg').readAsBytes()
).wait;
final prompt = TextPart("What's different between these pictures?");
final imageParts = [
DataPart('image/jpeg', firstImage),
DataPart('image/jpeg', secondImage),
];
final response = await model.generateContent([
Content.multi([prompt, ...imageParts])
]);
print(response.text);
}
মাল্টি-টার্ন কথোপকথন তৈরি করুন (চ্যাট)
মিথুন ব্যবহার করে, আপনি একাধিক বাঁক জুড়ে ফ্রিফর্ম কথোপকথন তৈরি করতে পারেন। SDK কথোপকথনের অবস্থা পরিচালনা করে প্রক্রিয়াটিকে সরল করে, তাই generateContent
এর বিপরীতে, আপনাকে কথোপকথনের ইতিহাস নিজেকে সংরক্ষণ করতে হবে না।
একটি মাল্টি-টার্ন কথোপকথন তৈরি করতে (যেমন চ্যাট), একটি Gemini 1.5 মডেল বা Gemini 1.0 Pro মডেল ব্যবহার করুন এবং startChat()
কল করে চ্যাট শুরু করুন৷ তারপর একটি নতুন ব্যবহারকারীর বার্তা পাঠাতে sendMessage()
ব্যবহার করুন, যা চ্যাট ইতিহাসে বার্তা এবং প্রতিক্রিয়াও যুক্ত করবে।
কথোপকথনে বিষয়বস্তুর সাথে যুক্ত role
জন্য দুটি সম্ভাব্য বিকল্প রয়েছে:
user
: ভূমিকা যা প্রম্পট প্রদান করে। এই মানটিsendMessage
কলের জন্য ডিফল্ট, এবং যদি একটি ভিন্ন ভূমিকা পাস করা হয় তবে ফাংশনটি একটি ব্যতিক্রম নিক্ষেপ করবে।model
: ভূমিকা যা প্রতিক্রিয়া প্রদান করে। বিদ্যমানhistory
সহstartChat()
কল করার সময় এই ভূমিকাটি ব্যবহার করা যেতে পারে।
import 'dart:io';
import 'package:google_generative_ai/google_generative_ai.dart';
Future<void> main() async {
// Access your API key as an environment variable (see "Set up your API key" above)
final apiKey = Platform.environment['API_KEY'];
if (apiKey == null) {
print('No \$API_KEY environment variable');
exit(1);
}
// The Gemini 1.5 models are versatile and work with multi-turn conversations (like chat)
final model = GenerativeModel(
model: 'gemini-1.5-flash',
apiKey: apiKey,
generationConfig: GenerationConfig(maxOutputTokens: 100));
// Initialize the chat
final chat = model.startChat(history: [
Content.text('Hello, I have 2 dogs in my house.'),
Content.model([TextPart('Great to meet you. What would you like to know?')])
]);
var content = Content.text('How many paws are in my house?');
var response = await chat.sendMessage(content);
print(response.text);
}
দ্রুত মিথস্ক্রিয়া জন্য স্ট্রিমিং ব্যবহার করুন
ডিফল্টরূপে, মডেল পুরো প্রজন্মের প্রক্রিয়া শেষ করার পরে একটি প্রতিক্রিয়া প্রদান করে। আপনি সম্পূর্ণ ফলাফলের জন্য অপেক্ষা না করে দ্রুত মিথস্ক্রিয়া অর্জন করতে পারেন এবং পরিবর্তে আংশিক ফলাফলগুলি পরিচালনা করতে স্ট্রিমিং ব্যবহার করতে পারেন।
নিচের উদাহরণে দেখানো হয়েছে কিভাবে generateContentStream
পদ্ধতির সাহায্যে একটি টেক্সট-এবং-ইমেজ ইনপুট প্রম্পট থেকে টেক্সট জেনারেট করতে হয়।
// ...
final response = model.generateContentStream([
Content.multi([prompt, ...imageParts])
]);
await for (final chunk in response) {
print(chunk.text);
}
// ...
আপনি শুধুমাত্র পাঠ্য ইনপুট এবং চ্যাট ব্যবহারের ক্ষেত্রে একটি অনুরূপ পদ্ধতি ব্যবহার করতে পারেন।
// Use streaming with text-only input
final response = model.generateContentStream(content);
// Use streaming with multi-turn conversations (like chat)
final response = chat.sendMessageStream(content);
উন্নত ব্যবহারের ক্ষেত্রে প্রয়োগ করুন
এই টিউটোরিয়ালের পূর্ববর্তী বিভাগে বর্ণিত সাধারণ ব্যবহারের ক্ষেত্রে আপনাকে Gemini API ব্যবহারে স্বাচ্ছন্দ্য বোধ করতে সাহায্য করে। এই বিভাগে কিছু ব্যবহারের ক্ষেত্রে বর্ণনা করা হয়েছে যেগুলি আরও উন্নত বলে বিবেচিত হতে পারে।
ফাংশন কলিং
ফাংশন কলিং আপনার জন্য জেনারেটিভ মডেল থেকে স্ট্রাকচার্ড ডেটা আউটপুট পেতে সহজ করে তোলে। তারপরে আপনি এই আউটপুটগুলি ব্যবহার করে অন্যান্য API কল করতে এবং মডেলে প্রাসঙ্গিক প্রতিক্রিয়া ডেটা ফেরত দিতে পারেন। অন্য কথায়, ফাংশন কলিং আপনাকে জেনারেটিভ মডেলগুলিকে বাহ্যিক সিস্টেমের সাথে সংযুক্ত করতে সাহায্য করে যাতে তৈরি করা সামগ্রীতে সর্বাধিক আপ-টু-ডেট এবং সঠিক তথ্য অন্তর্ভুক্ত থাকে। ফাংশন কলিং টিউটোরিয়ালে আরও জানুন।
এম্বেডিং ব্যবহার করুন
এমবেডিং হল এমন একটি কৌশল যা তথ্যকে একটি অ্যারেতে ভাসমান পয়েন্ট সংখ্যার তালিকা হিসাবে উপস্থাপন করতে ব্যবহৃত হয়। মিথুনের সাথে, আপনি একটি ভেক্টরাইজড আকারে পাঠ্য (শব্দ, বাক্য এবং পাঠ্যের ব্লক) উপস্থাপন করতে পারেন, এটি তুলনা করা এবং এম্বেডিংগুলিকে বৈসাদৃশ্য করা সহজ করে তোলে। উদাহরণ স্বরূপ, যে দুটি পাঠ্য একই বিষয়বস্তু বা অনুভূতি ভাগ করে তাদের অনুরূপ এম্বেডিং থাকা উচিত, যা গাণিতিক তুলনা কৌশল যেমন কোসাইন সাদৃশ্যের মাধ্যমে চিহ্নিত করা যেতে পারে।
এমবেডিং তৈরি করতে embedContent
পদ্ধতি (বা batchEmbedContent
পদ্ধতি) সহ embedding-001
মডেল ব্যবহার করুন। নিম্নলিখিত উদাহরণটি একটি একক স্ট্রিংয়ের জন্য একটি এম্বেডিং তৈরি করে:
final model = GenerativeModel(model: 'embedding-001', apiKey: apiKey);
final content = Content.text('The quick brown fox jumps over the lazy dog.');
final result = await model.embedContent(content);
print(result.embedding.values);
টোকেন গণনা করুন
দীর্ঘ প্রম্পট ব্যবহার করার সময়, মডেলে কোনো সামগ্রী পাঠানোর আগে টোকেন গণনা করা কার্যকর হতে পারে। নিম্নলিখিত উদাহরণগুলি বিভিন্ন ব্যবহারের ক্ষেত্রে countTokens()
কীভাবে ব্যবহার করতে হয় তা দেখায়:
// For text-only input
final tokenCount = await model.countTokens(Content.text(prompt));
print('Token count: ${tokenCount.totalTokens}');
// For text-and-image input (multimodal)
final tokenCount = await model.countTokens([
Content.multi([prompt, ...imageParts])
]);
print('Token count: ${tokenCount.totalTokens}');
// For multi-turn conversations (like chat)
final prompt = Content.text(message);
final allContent = [...chat.history, prompt];
final tokenCount = await model.countTokens(allContent);
print('Token count: ${tokenCount.totalTokens}');
বিষয়বস্তু তৈরি নিয়ন্ত্রণ করার বিকল্প
আপনি মডেল প্যারামিটার কনফিগার করে এবং নিরাপত্তা সেটিংস ব্যবহার করে সামগ্রী তৈরি নিয়ন্ত্রণ করতে পারেন।
মনে রাখবেন যে generationConfig
বা safetySettings
একটি মডেল অনুরোধ পদ্ধতিতে (যেমন generateContent
) পাস করা হলে getGenerativeModel
এ পাস করা একই নামের সাথে কনফিগারেশন অবজেক্ট সম্পূর্ণরূপে ওভাররাইড হবে।
মডেল প্যারামিটার কনফিগার করুন
আপনি মডেলে পাঠানো প্রতিটি প্রম্পটে প্যারামিটার মান অন্তর্ভুক্ত করে যা নিয়ন্ত্রণ করে কিভাবে মডেলটি একটি প্রতিক্রিয়া তৈরি করে। মডেল বিভিন্ন পরামিতি মান জন্য বিভিন্ন ফলাফল তৈরি করতে পারে. মডেল প্যারামিটার সম্পর্কে আরও জানুন। কনফিগারেশন আপনার মডেল উদাহরণের জীবনকালের জন্য বজায় রাখা হয়।
final generationConfig = GenerationConfig(
stopSequences: ["red"],
maxOutputTokens: 200,
temperature: 0.9,
topP: 0.1,
topK: 16,
);
final model = GenerativeModel(
// The Gemini 1.5 models are versatile and work with most use cases
model: 'gemini-1.5-flash',
apiKey: apiKey,
generationConfig: generationConfig,
);
নিরাপত্তা সেটিংস ব্যবহার করুন
ক্ষতিকারক বলে বিবেচিত প্রতিক্রিয়া পাওয়ার সম্ভাবনা সামঞ্জস্য করতে আপনি নিরাপত্তা সেটিংস ব্যবহার করতে পারেন। ডিফল্টরূপে, নিরাপত্তা সেটিংস মাঝারি এবং/অথবা সমস্ত মাত্রা জুড়ে অনিরাপদ বিষয়বস্তু হওয়ার উচ্চ সম্ভাবনা সহ সামগ্রীকে ব্লক করে। নিরাপত্তা সেটিংস সম্পর্কে আরও জানুন।
এখানে কিভাবে একটি নিরাপত্তা সেটিং সেট করতে হয়:
final safetySettings = [
SafetySetting(HarmCategory.harassment, HarmBlockThreshold.high)
];
final model = GenerativeModel(
// The Gemini 1.5 models are versatile and work with most use cases
model: 'gemini-1.5-flash',
apiKey: apiKey,
safetySettings: safetySettings,
);
এছাড়াও আপনি একাধিক নিরাপত্তা সেটিং সেট করতে পারেন:
final safetySettings = [
SafetySetting(HarmCategory.harassment, HarmBlockThreshold.high),
SafetySetting(HarmCategory.hateSpeech, HarmBlockThreshold.high),
];
এরপর কি
প্রম্পট ডিজাইন হল প্রম্পট তৈরি করার প্রক্রিয়া যা ভাষার মডেলগুলি থেকে পছন্দসই প্রতিক্রিয়া প্রকাশ করে। একটি ভাষা মডেল থেকে সঠিক, উচ্চ মানের প্রতিক্রিয়া নিশ্চিত করার জন্য ভাল কাঠামোগত প্রম্পট লেখা একটি অপরিহার্য অংশ। প্রম্পট লেখার জন্য সর্বোত্তম অনুশীলন সম্পর্কে জানুন।
মিথুন বিভিন্ন ব্যবহারের ক্ষেত্রে যেমন ইনপুট প্রকার এবং জটিলতা, চ্যাট বা অন্যান্য ডায়ালগ ভাষার কাজের জন্য বাস্তবায়ন এবং আকারের সীমাবদ্ধতাগুলির প্রয়োজন মেটাতে বিভিন্ন মডেলের বৈচিত্র অফার করে। উপলব্ধ মিথুন মডেল সম্পর্কে জানুন।