Этот набор инструментов предоставляет ресурсы для применения лучших практик ответственного использования открытых моделей, таких как модели Gemma, в том числе:
- Руководство по установлению политик безопасности, настройке безопасности, классификаторам безопасности и оценке моделей.
- Инструмент интерпретации обучения (LIT) для изучения поведения Джеммы и решения потенциальных проблем.
- Методика построения надежных классификаторов безопасности с минимальным количеством примеров.
Эта версия инструментария ориентирована только на модели преобразования текста в текст на английском языке. Вы можете оставить отзыв, чтобы сделать этот набор инструментов более полезным, воспользовавшись ссылкой на механизм обратной связи внизу страницы.
При создании с помощью Gemma вам следует проявлять целостный подход к ответственности и учитывать все возможные проблемы на уровне приложения и модели. В этом наборе инструментов рассматриваются методы снижения рисков и их снижения для обеспечения безопасности, конфиденциальности, справедливости и подотчетности.
Ознакомьтесь с остальной частью этого набора инструментов для получения дополнительной информации и рекомендаций:
- Оцените риски и установите политику безопасности
- Настройте модели для обеспечения безопасности
- Создайте средства защиты ввода и вывода
- Оценить модель и систему на предмет безопасности
- Создание артефактов прозрачности
- Анализ поведения модели
Авторы и участники
Этот набор инструментов основан на исследованиях и инструментах различных команд Google, включая следующих авторов и участников:
Людовик Перан, Кэти Мейер-Хеллстерн, Лукас Диксон, Рина Яна, Оскар Валтинес, Клемент Крепи, Райан Маллинз, Йен Тенни, Тед Клименко, Шри Пандия, Нитум Тейн, Маккензи Томас, Хайден Шаффер, Бин Ду, Селим Эль-Сайед, Паркер Барнс, Мадлен Илиш, Грэйс Ву, Трис Уоркентин, Мари Пелла