Ответственный | Responsible Generative AI Toolkit

Создайте ответственный подход

Заблаговременно выявите потенциальные риски вашего приложения и определите подход на уровне системы для создания безопасных и ответственных приложений для пользователей.

Начать

Определение политик системного уровня

Определите, какой тип контента должно и не должно создавать ваше приложение.

Дизайн для безопасности

Определите свой общий подход к внедрению методов снижения рисков, принимая во внимание технические и деловые компромиссы.

Узнать больше

Будьте прозрачными

Сообщите о своем подходе с помощью таких артефактов, как карточки-модели.

См. шаблоны

Безопасные системы искусственного интеллекта

Рассмотрите риски безопасности, связанные с ИИ, и методы их устранения, описанные в Secure AI Framework (SAIF).

Выровняйте свою модель

Приведите свою модель в соответствие с конкретной политикой безопасности, используя методы подсказок и настройки.

Начать

Создавайте более безопасные и надежные подсказки

Используйте возможности LLM для создания более безопасных шаблонов подсказок с помощью библиотеки Model Alignment.

Настройте модели для обеспечения безопасности

Управляйте поведением модели, настраивая ее в соответствии с вашими политиками безопасности и контента.

Изучите подсказки модели

Создавайте безопасные и полезные подсказки посредством итеративного улучшения с помощью инструмента интерпретации обучения (LIT).

Оцените свою модель

Оцените риски модели с точки зрения безопасности, справедливости и фактической точности, используя наши рекомендации и инструменты.

Начать

LLM Компаратор

Проводите параллельные оценки с помощью LLM Comparator, чтобы качественно оценить различия в ответах между моделями, разные подсказки для одной и той же модели или даже разные настройки модели.

Рекомендации по оценке модели

Узнайте о передовом опыте создания красной команды и оцените свою модель по академическим критериям, чтобы оценить вред, наносимый безопасности, справедливости и фактологии.

Защитите с помощью гарантий

Фильтруйте входные и выходные данные вашего приложения и защищайте пользователей от нежелательных результатов.

Начать

Текст SynthID

Инструмент для нанесения водяных знаков и обнаружения текста, созданного вашей моделью.

Текстовые водяные знаки SynthID

ЩитДжемма

Серия классификаторов безопасности контента, построенных на Gemma 2, доступных в трех размерах: 2B, 9B, 27B.

Классификаторы безопасности контента ShieldGemma

Гибкие классификаторы

Создавайте классификаторы безопасности для ваших конкретных политик, используя эффективную настройку параметров (PET) с относительно небольшим количеством обучающих данных.

Создайте классификаторы безопасности

Проверяет безопасность ИИ

Обеспечьте соответствие безопасности ИИ вашим политикам в отношении контента с помощью API и панелей мониторинга.

Проверяет безопасность ИИ

Служба модерации текста

Определите список атрибутов безопасности, включая различные потенциально опасные категории и темы, которые могут считаться конфиденциальными, с помощью этого API Google Cloud Natural Language, доступного бесплатно при достижении определенного лимита использования.

Перспективный API

Выявляйте «ядовитые» комментарии с помощью этого бесплатного API Google Jigsaw, чтобы снизить токсичность в Интернете и обеспечить здоровый диалог.

Перспективный API

Инструментарий ответственного генеративного искусственного интеллекта