Pratinjau Gemini 2.5 Pro kini tersedia untuk penggunaan produksi. Pelajari lebih lanjut

Halaman ini diterjemahkan oleh Cloud Translation API.

Setelan keamanan

Gemini API menyediakan setelan keamanan yang dapat Anda sesuaikan selama tahap pembuatan prototipe untuk menentukan apakah aplikasi Anda memerlukan konfigurasi keamanan yang lebih ketat atau longgar. Anda dapat menyesuaikan setelan ini di lima kategori filter untuk membatasi atau mengizinkan jenis konten tertentu.

Panduan ini membahas cara Gemini API menangani setelan dan pemfilteran keamanan serta cara Anda dapat mengubah setelan keamanan untuk aplikasi.

Filter keamanan

Filter keamanan Gemini API yang dapat disesuaikan mencakup kategori berikut:

Kategori	Deskripsi
Pelecehan	Komentar negatif atau berbahaya yang menargetkan atribut identitas dan/atau dilindungi.
Ujaran kebencian	Konten yang kasar, tidak sopan, atau tidak senonoh.
Seksual vulgar	Berisi referensi ke tindakan seksual atau konten cabul lainnya.
Berbahaya	Mempromosikan, memfasilitasi, atau mendorong tindakan berbahaya.
Integritas sipil	Kueri terkait pemilu.

Kategori ini ditentukan dalam HarmCategory. Model Gemini hanya mendukung HARM_CATEGORY_HARASSMENT, HARM_CATEGORY_HATE_SPEECH, HARM_CATEGORY_SEXUALLY_EXPLICIT, HARM_CATEGORY_DANGEROUS_CONTENT, dan HARM_CATEGORY_CIVIC_INTEGRITY. Semua kategori lainnya hanya digunakan oleh model PaLM 2 (Lama).

Anda dapat menggunakan filter ini untuk menyesuaikan hal yang sesuai dengan kasus penggunaan Anda. Misalnya, jika Anda membuat dialog video game, Anda mungkin menganggapnya wajar untuk mengizinkan lebih banyak konten yang diberi rating Berbahaya karena karakteristik game itu sendiri.

Selain filter keamanan yang dapat disesuaikan, Gemini API memiliki perlindungan bawaan terhadap bahaya inti, seperti konten yang membahayakan keselamatan anak. Jenis bahaya ini selalu diblokir dan tidak dapat disesuaikan.

Tingkat pemfilteran keamanan konten

Gemini API mengategorikan tingkat probabilitas konten yang tidak aman sebagai HIGH, MEDIUM, LOW, atau NEGLIGIBLE.

Gemini API memblokir konten berdasarkan kemungkinan konten tidak aman, bukan tingkat keparahannya. Hal ini penting untuk dipertimbangkan karena beberapa konten dapat memiliki kemungkinan rendah untuk dianggap tidak aman, meskipun tingkat keparahan bahayanya masih tinggi. Misalnya, membandingkan kalimat:

Robot itu memukul saya.
Robot itu menebas saya.

Kalimat pertama dapat menyebabkan kemungkinan konten tidak aman yang lebih tinggi, tetapi Anda dapat menganggap kalimat kedua sebagai tingkat keparahan yang lebih tinggi dalam hal kekerasan. Oleh karena itu, penting bagi Anda untuk menguji dengan cermat dan mempertimbangkan tingkat pemblokiran yang sesuai yang diperlukan untuk mendukung kasus penggunaan utama Anda sekaligus meminimalkan bahaya bagi pengguna akhir.

Pemfilteran keamanan per permintaan

Anda dapat menyesuaikan setelan keamanan untuk setiap permintaan yang Anda buat ke API. Saat Anda membuat permintaan, konten akan dianalisis dan diberi rating keamanan. Peringkat keamanan mencakup kategori dan probabilitas klasifikasi bahaya. Misalnya, jika konten diblokir karena kategori pelecehan memiliki probabilitas tinggi, rating keamanan yang ditampilkan akan memiliki kategori yang sama dengan HARASSMENT dan probabilitas bahaya ditetapkan ke HIGH.

Secara default, setelan keamanan memblokir konten (termasuk perintah) dengan probabilitas sedang atau lebih tinggi sebagai tidak aman di seluruh filter. Keamanan dasar ini dirancang agar berfungsi di sebagian besar kasus penggunaan, sehingga Anda hanya perlu menyesuaikan setelan keamanan jika memiliki kebutuhan yang konsisten untuk aplikasi Anda.

Tabel berikut menjelaskan setelan pemblokiran yang dapat Anda sesuaikan untuk setiap kategori. Misalnya, jika Anda menetapkan setelan pemblokiran ke Block few untuk kategori Hate speech, semua konten yang memiliki probabilitas tinggi sebagai konten ujaran kebencian akan diblokir. Namun, apa pun dengan probabilitas yang lebih rendah diizinkan.

Batas (Google AI Studio)	Batas (API)	Deskripsi
Block none	`BLOCK_NONE`	Selalu tampilkan terlepas dari probabilitas konten tidak aman
Memblokir beberapa	`BLOCK_ONLY_HIGH`	Blokir jika ada probabilitas tinggi konten tidak aman
Memblokir beberapa	`BLOCK_MEDIUM_AND_ABOVE`	Blokir jika ada probabilitas sedang atau tinggi konten tidak aman
Memblokir sebagian besar	`BLOCK_LOW_AND_ABOVE`	Blokir jika ada probabilitas rendah, sedang, atau tinggi konten tidak aman
T/A	`HARM_BLOCK_THRESHOLD_UNSPECIFIED`	Batas tidak ditentukan, blokir menggunakan batas default

Jika nilai minimum tidak ditetapkan, nilai minimum pemblokiran default adalah Blokir tidak ada (untuk gemini-1.5-pro-002 dan gemini-1.5-flash-002 serta semua model GA stabil yang lebih baru) atau Blokir beberapa (di semua model lainnya) untuk semua kategori kecuali kategori Integritas sipil.

Batas pemblokiran default untuk kategori Integritas sipil adalah Jangan blokir (untuk gemini-2.0-flash-001 dengan alias gemini-2.0-flash, gemini-2.0-pro-exp-02-05, dan gemini-2.0-flash-lite) baik untuk Google AI Studio maupun Gemini API, dan Blokir sebagian besar untuk semua model lainnya di Google AI Studio saja.

Anda dapat menetapkan setelan ini untuk setiap permintaan yang Anda buat ke layanan generatif. Lihat referensi API HarmBlockThreshold untuk mengetahui detailnya.

Masukan keamanan

generateContent menampilkan GenerateContentResponse yang menyertakan masukan keamanan.

Masukan perintah disertakan dalam promptFeedback. Jika promptFeedback.blockReason ditetapkan, konten perintah akan diblokir.

Masukan kandidat respons disertakan dalam Candidate.finishReason dan Candidate.safetyRatings. Jika konten respons diblokir dan finishReason adalah SAFETY, Anda dapat memeriksa safetyRatings untuk mengetahui detail selengkapnya. Konten yang diblokir tidak ditampilkan.

Menyesuaikan setelan keamanan

Bagian ini membahas cara menyesuaikan setelan keamanan di Google AI Studio dan di kode Anda.

Google AI Studio

Anda dapat menyesuaikan setelan keamanan di Google AI Studio, tetapi tidak dapat menonaktifkannya.

Klik Edit safety settings di panel Run settings untuk membuka modal Run safety settings. Dalam modal, Anda dapat menggunakan penggeser untuk menyesuaikan tingkat pemfilteran konten per kategori keamanan:

Saat Anda mengirim permintaan (misalnya, dengan mengajukan pertanyaan kepada model), pesan Tidak Ada Konten akan muncul jika konten permintaan diblokir. Untuk melihat detail selengkapnya, arahkan kursor ke teks Tidak Ada Konten, lalu klik Keamanan.

SDK Gemini API

Cuplikan kode berikut menunjukkan cara menyetel setelan keamanan dalam panggilan GenerateContent. Tindakan ini akan menetapkan nilai minimum untuk kategori pelecehan (HARM_CATEGORY_HARASSMENT) dan ujaran kebencian (HARM_CATEGORY_HATE_SPEECH). Misalnya, menetapkan kategori ini ke BLOCK_LOW_AND_ABOVE akan memblokir konten apa pun yang memiliki probabilitas rendah atau lebih tinggi sebagai pelecehan atau ujaran kebencian. Untuk memahami setelan nilai minimum, lihat Pemfilteran keamanan per permintaan.

PythonGoJavaScriptDart (Flutter)KotlinJavaREST

from google import genai
from google.genai import types

import PIL.Image

img = PIL.Image.open("cookies.jpg")

client = genai.Client(api_key="GEMINI_API_KEY")

response = client.models.generate_content(
    model="gemini-2.0-flash",
    contents=['Do these look store-bought or homemade?', img],
    config=types.GenerateContentConfig(
      safety_settings=[
        types.SafetySetting(
            category=types.HarmCategory.HARM_CATEGORY_HATE_SPEECH,
            threshold=types.HarmBlockThreshold.BLOCK_LOW_AND_ABOVE,
        ),
      ]
    )
)

print(response.text)

package main

import (
    "context"
    "fmt"
    "log"

    "google.golang.org/genai"
)

func main() {
    ctx := context.Background()
    client, err := genai.NewClient(ctx, &genai.ClientConfig{
        APIKey:  "GOOGLE_API_KEY",
        Backend: genai.BackendGeminiAPI,
    })
    if err != nil {
        log.Fatal(err)
    }

    config := &genai.GenerateContentConfig{
        SafetySettings: []*genai.SafetySetting{
            {
                Category:  "HARM_CATEGORY_HATE_SPEECH",
                Threshold: "BLOCK_LOW_AND_ABOVE",
            },
        },
    }

    response, err := client.Models.GenerateContent(
        ctx,
        "gemini-2.0-flash",
        genai.Text("Some potentially unsafe prompt."),
        config,
    )
    if err != nil {
        log.Fatal(err)
    }
    fmt.Println(response.Text())
}

import { GoogleGenAI } from "@google/genai";

const ai = new GoogleGenAI({ apiKey: "GEMINI_API_KEY" });

const safetySettings = [
  {
    category: "HARM_CATEGORY_HARASSMENT",
    threshold: "BLOCK_LOW_AND_ABOVE",
  },
  {
    category: "HARM_CATEGORY_HATE_SPEECH",
    threshold: "BLOCK_LOW_AND_ABOVE",
  },
];

async function main() {
  const response = await ai.models.generateContent({
    model: "gemini-2.0-flash",
    contents: "Some potentially unsafe prompt.",
    config: {
      safetySettings: safetySettings,
    },
  });
  console.log(response.text);
}

await main();

final safetySettings = [
  SafetySetting(HarmCategory.harassment, HarmBlockThreshold.low),
  SafetySetting(HarmCategory.hateSpeech, HarmBlockThreshold.low),
];
final model = GenerativeModel(
  model: 'gemini-1.5-flash',
  apiKey: apiKey,
  safetySettings: safetySettings,
);

val harassmentSafety = SafetySetting(HarmCategory.HARASSMENT, BlockThreshold.LOW_AND_ABOVE)

val hateSpeechSafety = SafetySetting(HarmCategory.HATE_SPEECH, BlockThreshold.LOW_AND_ABOVE)

val generativeModel = GenerativeModel(
    modelName = "gemini-1.5-flash",
    apiKey = BuildConfig.apiKey,
    safetySettings = listOf(harassmentSafety, hateSpeechSafety)
)

SafetySetting harassmentSafety = new SafetySetting(HarmCategory.HARASSMENT,
    BlockThreshold.LOW_AND_ABOVE);

SafetySetting hateSpeechSafety = new SafetySetting(HarmCategory.HATE_SPEECH,
    BlockThreshold.LOW_AND_ABOVE);

GenerativeModel gm = new GenerativeModel(
    "gemini-1.5-flash",
    BuildConfig.apiKey,
    null, // generation config is optional
    Arrays.asList(harassmentSafety, hateSpeechSafety)
);

GenerativeModelFutures model = GenerativeModelFutures.from(gm);

    echo '{
    "safetySettings": [
        {"category": "HARM_CATEGORY_HARASSMENT", "threshold": "BLOCK_ONLY_HIGH"},
        {"category": "HARM_CATEGORY_HATE_SPEECH", "threshold": "BLOCK_MEDIUM_AND_ABOVE"}
    ],
    "contents": [{
        "parts":[{
            "text": "'I support Martians Soccer Club and I think Jupiterians Football Club sucks! Write a ironic phrase about them.'"}]}]}' > request.json

curl "https://generativelanguage.googleapis.com/v1beta/models/gemini-2.0-flash:generateContent?key=$GEMINI_API_KEY" \
    -H 'Content-Type: application/json' \
    -X POST \
    -d @request.json 2> /dev/nullsafety_settings.sh

Langkah berikutnya

Lihat referensi API untuk mempelajari API lengkap lebih lanjut.
Tinjau panduan keselamatan untuk melihat secara umum pertimbangan keamanan saat mengembangkan dengan LLM.
Pelajari lebih lanjut cara menilai probabilitas versus tingkat keparahan dari tim Jigsaw
Pelajari lebih lanjut produk yang berkontribusi pada solusi keselamatan seperti Perspective API. * Anda dapat menggunakan setelan keamanan ini untuk membuat pengklasifikasi toksisitas. Lihat contoh klasifikasi untuk memulai.