運用 Gemini API 探索視覺功能

Gemini API 可以對傳遞的圖片和影片進行推論。通過時 圖片、一組圖片或影片,Gemini 就能:

  • 說明或回答內容相關問題
  • 提供內容的摘要
  • 從內容推斷

本教學課程示範了使用以下程式碼來提示 Gemini API 的一些方法: 圖片與影片輸入內容所有輸出內容皆為純文字。

後續步驟

本指南說明 generateContent 和 根據圖片和影片輸入內容生成文字輸出內容如要瞭解詳情 請參閱下列資源:

  • 使用媒體檔案發出提示: Gemini API 支援透過文字、圖片、音訊和影片資料提示使用者 稱為「多模態提示」
  • 系統操作說明:系統 指示能讓您根據具體的 需求和用途
  • 安全指南:生成式 AI 有時 模型會產生非預期的輸出內容 任何偏見或令人反感的內容後續處理和人工評估 以降低這類輸出的傷害風險