Ta strona została przetłumaczona przez Cloud Translation API.

Zestaw narzędzi odpowiedzialnej generatywnej AI

Narzędzia i wskazówki do odpowiedzialnego projektowania, tworzenia i oceny otwartych modeli AI.

Odpowiedzialny projekt aplikacji

Określ zasady działania modelu, stwórz bezpieczną i odpowiedzialną aplikację oraz utrzymuj przejrzystą komunikację z użytkownikami.

Dopasowanie do bezpieczeństwa

Poznaj techniki debugowania promptów i wskazówki dotyczące dostrojenia i RLHF, aby dostosować modele AI do zasad bezpieczeństwa.

Ocena modelu

Znajdź wskazówki i dane, które pomogą Ci przeprowadzić dokładną ocenę modelu pod kątem bezpieczeństwa, rzetelności i rzeczywistości za pomocą narzędzia LLM Comparator.

Środki ochrony

Wdróż klasyfikatory bezpieczeństwa, korzystając z gotowych rozwiązań lub tworząc własne za pomocą samouczków krok po kroku.

Odpowiedzialne podejście do projektowania

Proaktywnie identyfikuj potencjalne zagrożenia związane z aplikacją i określaj podejście na poziomie systemu, aby tworzyć bezpieczne i odpowiedzialne aplikacje dla użytkowników.

Rozpocznij

Definiowanie zasad na poziomie systemu

Określ, jakiego typu treści powinna, a jakiego nie powinna generować aplikacja.

Projektowanie z myślą o bezpieczeństwie

Określ ogólne podejście do wdrażania technik ograniczania ryzyka, biorąc pod uwagę kompromisy techniczne i biznesowe.

Więcej informacji

Postaw na szczerość

Komunikowanie podejścia za pomocą artefaktów, takich jak karty modeli.

Zobacz szablony

Bezpieczne systemy AI

Weź pod uwagę zagrożenia dla bezpieczeństwa związane z AI i metody ich usuwania opisane w Secure AI Framework (SAIF).

Wyrównaj model

Dopasuj model do określonych zasad bezpieczeństwa, korzystając z technik promptów i dostrajania.

Rozpocznij

Tworzenie bezpieczniejszych i bardziej niezawodnych promptów

Korzystaj z potencjału modeli LLM, aby tworzyć bezpieczniejsze prompty za pomocą biblioteki Model Alignment.

Dostosowywanie modeli pod kątem bezpieczeństwa

Kontrolowanie zachowania modelu przez dostosowanie go do zasad bezpieczeństwa i zawartości.

Sprawdzanie promptów modelu

Tworzenie bezpiecznych i przydatnych promptów dzięki stopniowemu ulepszaniu za pomocą narzędzia do analizowania interpretowalności (LIT).

Ocenianie modelu

Oceniaj ryzyko związane z modelem pod kątem bezpieczeństwa, sprawiedliwości i poprawności merytorycznej, korzystając z naszych wskazówek i narzędzi.

Rozpocznij

Komparator LLM

przeprowadzać bezpośrednie porównania za pomocą narzędzia LLM Comparator, aby jakościowo ocenić różnice w odpowiedziach między modelami, różnych promptach dla tego samego modelu lub nawet różnych ustawieniach tego samego modelu;

Wytyczne dotyczące oceny modelu

Poznaj sprawdzone metody red-teamingu i oceń swój model na tle akademickich benchmarków, aby ocenić szkody związane z bezpieczeństwem, uczciwością i rzeczywistością.

Ochrona za pomocą zabezpieczeń

Filtruj dane wejściowe i wyjściowe aplikacji oraz chroń użytkowników przed niepożądanymi wynikami.

Rozpocznij

Tekst SynthID

Narzędzie do dodawania znaków wodnych i wykrywania tekstu wygenerowanego przez model.

Dodawanie znaku wodnego tekstowego za pomocą SynthID

ShieldGemma

Seria klasyfikatorów bezpieczeństwa treści opartych na Gemma 2, dostępnych w 3 rozmiarach: 2B, 9B i 27B.

Klasyfikatory bezpieczeństwa treści ShieldGemma

Klasyfikatory elastyczne

Tworzenie klasyfikatorów bezpieczeństwa dla określonych zasad za pomocą wydajnego dostrajania parametrów (PET) przy użyciu stosunkowo niewielkiej ilości danych szkoleniowych.

Tworzenie klasyfikatorów bezpieczeństwa

Bezpieczeństwo AI

Za pomocą interfejsów API i paneli monitorowania możesz zapewnić zgodność AI z zasadami bezpieczeństwa treści.

Sprawdzanie bezpieczeństwa AI

Usługa moderacji tekstu

Wykrywanie listy atrybutów bezpieczeństwa, w tym różnych potencjalnie szkodliwych kategorii i tematów, które można uznać za wrażliwe, za pomocą interfejsu Natural Language API w Google Cloud dostępnego bezpłatnie w ramach określonego limitu użycia.

Perspective API

Wykrywanie „toksycznych” komentarzy za pomocą bezpłatnego interfejsu Google Jigsaw API w celu ograniczenia toksyczności w internecie i zapewnienia możliwości prowadzenia zdrowej dyskusji.

Perspective API