探索 Gemini API 的视觉功能
使用集合让一切井井有条
根据您的偏好保存内容并对其进行分类。
Gemini API 可以对传递给它的图片和视频进行推理。向 Gemini 传递图片、一系列图片或视频后,可以:
- 描述或回答与内容相关的问题
- 总结内容
- 根据内容推断
本教程演示了向 Gemini API 发出图片和视频输入提示的一些可能方法。所有输出均为纯文本。
后续步骤
本指南介绍了如何使用 generateContent
以及如何根据图片和视频输入生成文本输出。如需了解详情,请参阅以下资源:
- 使用媒体文件进行提示:Gemini API 支持使用文本、图片、音频和视频数据进行提示,也称为多模态提示。
- 系统指令:借助系统指令,您可以根据自己的特定需求和用例来引导模型的行为。
- 安全指南:有时,生成式 AI 模型会生成意外输出,例如不准确、有偏差或令人反感的输出。后期处理和人工评估对于限制此类输出造成伤害的风险至关重要。
如未另行说明,那么本页面中的内容已根据知识共享署名 4.0 许可获得了许可,并且代码示例已根据 Apache 2.0 许可获得了许可。有关详情,请参阅 Google 开发者网站政策。Java 是 Oracle 和/或其关联公司的注册商标。
最后更新时间 (UTC):2024-06-26。
[{
"type": "thumb-down",
"id": "missingTheInformationINeed",
"label":"没有我需要的信息"
},{
"type": "thumb-down",
"id": "tooComplicatedTooManySteps",
"label":"太复杂/步骤太多"
},{
"type": "thumb-down",
"id": "outOfDate",
"label":"内容需要更新"
},{
"type": "thumb-down",
"id": "translationIssue",
"label":"翻译问题"
},{
"type": "thumb-down",
"id": "samplesCodeIssue",
"label":"示例/代码问题"
},{
"type": "thumb-down",
"id": "otherDown",
"label":"其他"
}]
[{
"type": "thumb-up",
"id": "easyToUnderstand",
"label":"易于理解"
},{
"type": "thumb-up",
"id": "solvedMyProblem",
"label":"解决了我的问题"
},{
"type": "thumb-up",
"id": "otherUp",
"label":"其他"
}]