Gemini API có thể tạo văn bản đầu ra từ nhiều loại dữ liệu đầu vào, bao gồm văn bản, hình ảnh, video và âm thanh. Bạn có thể sử dụng tính năng tạo văn bản cho nhiều ứng dụng, bao gồm:
- Viết mẫu quảng cáo
- Mô tả hoặc diễn giải tài sản đa phương tiện
- Hoàn tất văn bản
- Tóm tắt văn bản dạng tự do
- Dịch giữa các ngôn ngữ
- chatbot
- Các trường hợp sử dụng mới của riêng bạn
Hướng dẫn này chỉ cho bạn cách tạo văn bản bằng
generateContent
và
streamGenerateContent
API. Trọng tâm nằm ở đầu ra văn bản từ phương thức nhập chỉ có văn bản cũng như văn bản và hình ảnh. Người nhận
tìm hiểu thêm về việc nhắc đa phương thức bằng tệp video và âm thanh, hãy xem
Chiến lược nhắc tệp.
Các bước tiếp theo
Hướng dẫn này trình bày cách sử dụng
generateContent
và
streamGenerateContent
để tạo kết quả đầu ra văn bản từ đầu vào chỉ có văn bản cũng như văn bản và hình ảnh. Để tìm hiểu thêm
về cách tạo văn bản bằng Gemini API, hãy xem các tài nguyên sau:
- Chiến lược nhắc tệp: Gemini API hỗ trợ tính năng nhắc bằng dữ liệu văn bản, hình ảnh, âm thanh và video, đồng thời được gọi là nhắc đa phương thức.
- Hướng dẫn về hệ thống: Hệ thống cho phép bạn định hướng hành vi của mô hình dựa trên và trường hợp sử dụng.
- Hướng dẫn an toàn: Đôi khi có thể sử dụng AI tạo sinh các mô hình tạo ra kết quả không mong muốn, chẳng hạn như kết quả đầu ra không chính xác, thiên kiến hoặc phản cảm. Quy trình hậu xử lý và quy trình đánh giá thủ công có vai trò thiết yếu đối với việc hạn chế rủi ro thiệt hại từ các dữ liệu đầu ra đó.