Interfejs Gemini API może wnioskować na podstawie przekazanych obrazów i filmów. Po zaliczeniu Gemini może:
- Opisz treści lub odpowiedz na pytania na ich temat
- Streść treści
- wyciągaj wnioski na podstawie treści,
Ten samouczek przedstawia kilka możliwych sposobów tworzenia promptów dla interfejsu Gemini API obrazów i danych wejściowych wideo. Wszystkie dane wyjściowe zawierają tylko tekst.
Co dalej?
Z tego przewodnika dowiesz się, jak używać
generateContent
i
w celu generowania tekstowych wyników
z danych wejściowych obrazu i wideo. Aby dowiedzieć się więcej,
zajrzyj do tych materiałów:
- Wyświetlanie promptów przy użyciu plików multimedialnych: Gemini API obsługuje prompty z danymi tekstowymi, graficznymi, audio i wideo, nazywanych promptami multimodalnymi.
- Instrukcje systemowe: system które pozwalają sterować działaniem modelu w zależności od do potrzeb i przypadków użycia.
- Wskazówki dotyczące bezpieczeństwa: czasami generatywna AI modele generują nieoczekiwane wyniki, na przykład nieprawidłowe dane wyjściowe, stronniczych lub obraźliwych. Przetwarzanie końcowe i ocena manualna ma kluczowe znaczenie ograniczają ryzyko szkód takich jak dane wyjściowe.