يمكن لواجهة برمجة التطبيقات Gemini API إنشاء إخراج نصي عند تقديم نص وصور وفيديو وصوت كإدخال.
يوضّح لك هذا الدليل كيفية إنشاء نص باستخدام الطريقتَين
generateContent
و
streamGenerateContent
. للتعرّف على كيفية استخدام ميزات الرؤية والصوت في Gemini،
يُرجى الرجوع إلى دليلَي الرؤية والصوت.
إنشاء نص من إدخال نصي فقط
أبسط طريقة لإنشاء نص باستخدام Gemini API هي تزويد النموذج بإدخال نصي واحد فقط، كما هو موضّح في هذا المثال:
import google.generativeai as genai
genai.configure(api_key="GEMINI_API_KEY")
model = genai.GenerativeModel("gemini-1.5-flash")
response = model.generate_content("How does AI work?")
print(response.text)
في هذه الحالة، لا يتضمن الطلب ("شرح آلية عمل الذكاء الاصطناعي") أي أمثلة على النتائج أو تعليمات النظام أو معلومات التنسيق. وهي بلا مثال. في بعض حالات الاستخدام، قد يؤدي استخدام طلب لمرة واحدة أو لعدة مرات إلى تقديم نتيجة أكثر توافقًا مع توقعات المستخدم. في بعض الحالات، قد تحتاج أيضًا إلى تقديم تعليمات النظام لمساعدة النموذج في فهم المَهمّة أو اتّباع إرشادات محدّدة.
إنشاء نص من إدخال نص وصورة
تتيح Gemini API إدخالات متعددة الوسائط التي تجمع بين النصوص وملفات الوسائط. يوضّح المثال التالي كيفية إنشاء نص من إدخال نص وصورة:
import google.generativeai as genai
import PIL.Image
genai.configure(api_key="GEMINI_API_KEY")
model = genai.GenerativeModel("gemini-1.5-flash")
organ = PIL.Image.open("/path/to/organ.png")
response = model.generate_content(["Tell me about this instrument", organ])
print(response.text)
إنشاء مصدر نصي
يعرض النموذج تلقائيًا استجابةً بعد إكمال عملية إنشاء النص بالكامل. يمكنك تحقيق تفاعلات أسرع من خلال عدم الانتظار للحصول على النتيجة الكاملة، واستخدام البث بدلاً من ذلك للتعامل مع النتائج الجزئية.
يوضّح المثال التالي كيفية تنفيذ البث باستخدام أسلوب
streamGenerateContent
ل
إنشاء نص من طلب إدخال نصي فقط.
import google.generativeai as genai
genai.configure(api_key="GEMINI_API_KEY")
model = genai.GenerativeModel("gemini-1.5-flash")
response = model.generate_content("Explain how AI works", stream=True)
for chunk in response:
print(chunk.text, end="")
إنشاء محادثة
يتيح لك حِزمة تطوير البرامج Gemini SDK جمع جولات متعددة من الأسئلة
والردود، ما يسمح للمستخدمين بالتقدّم تدريجيًا نحو العثور على إجابات أو الحصول على مساعدة بشأن المشاكل التي تتضمّن أجزاء متعددة. توفّر ميزة حزمة تطوير البرامج (SDK) هذه واجهة لتتبُّع سجلّ المحادثات، ولكنّها تستخدم generateContent
الطريقة نفسها من وراء الكواليس لإنشاء الردّ.
يعرض مثال الرمز البرمجي التالي عملية تنفيذ أساسية للمحادثة:
import google.generativeai as genai
genai.configure(api_key="GEMINI_API_KEY")
model = genai.GenerativeModel("gemini-1.5-flash")
chat = model.start_chat(
history=[
{"role": "user", "parts": "Hello"},
{"role": "model", "parts": "Great to meet you. What would you like to know?"},
]
)
response = chat.send_message("I have 2 dogs in my house.")
print(response.text)
response2 = chat.send_message("How many paws are in my house?")
print(response2.text)
يمكنك أيضًا استخدام ميزة البث مع المحادثة، كما هو موضّح في المثال التالي:
import google.generativeai as genai
genai.configure(api_key="GEMINI_API_KEY")
model = genai.GenerativeModel("gemini-1.5-flash")
chat = model.start_chat(
history=[
{"role": "user", "parts": "Hello"},
{"role": "model", "parts": "Great to meet you. What would you like to know?"},
]
)
response = chat.send_message("I have 2 dogs in my house.", stream=True)
for chunk in response:
print(chunk.text, end="")
response2 = chat.send_message("How many paws are in my house?", stream=True)
for chunk in response2:
print(chunk.text, end="")
print(chat.history)
ضبط إعدادات إنشاء النصوص
تتضمّن كلّ مطالبة ترسلها إلى النموذج
مَعلمات تتحكّم في كيفية إنشاء النموذج للردود. يمكنك استخدام
GenerationConfig
ل
ضبط هذه المَعلمات. في حال عدم ضبط المَعلمات، يستخدم النموذج
الخيارات التلقائية التي يمكن أن تختلف حسب النموذج.
يوضّح المثال التالي كيفية ضبط العديد من الخيارات المتاحة.
import google.generativeai as genai
genai.configure(api_key="GEMINI_API_KEY")
model = genai.GenerativeModel("gemini-1.5-flash")
response = model.generate_content(
"Explain how AI works",
generation_config = genai.GenerationConfig(
max_output_tokens=1000,
temperature=0.1,
)
)
print(response.text)
الخطوات التالية
بعد أن استكشافت أساسيات Gemini API، ننصحك بالمحاولة التالية:
- فهم الرؤية: تعرَّف على كيفية استخدام ميزة فهم الرؤية المضمّنة في Gemini لمعالجة الصور والفيديوهات.
- فهم الصوت: تعرَّف على كيفية استخدام ميزة فهم الصوت المضمّنة في Gemini لمعالجة الملفات الصوتية.