Phạm vi Gemma

Phân tích Gemma 3 bằng Gemma Scope 2

Gemma Scope 2 là một bộ công cụ toàn diện, nguồn mở để diễn giải, được thiết kế cho bộ sưu tập mô hình Gemma 3. Công cụ này cho phép bạn kiểm tra hành vi của từng lớp riêng lẻ. Công cụ này cho phép các nhà nghiên cứu phân tích hành vi phức tạp của mô hình ngôn ngữ và gỡ lỗi các hành vi mới xuất hiện như vượt rào hoặc ảo giác.

Bộ công cụ này đóng vai trò như một kính hiển vi cho mô hình, cung cấp Bộ mã hoá tự động thưa thớt (SAE)Bộ chuyển mã được huấn luyện trên mọi lớp của dòng Gemma 3.

Bạn đang tìm phiên bản trước?
Gemma Scope (dành cho Gemma 2) ban đầu vẫn được cung cấp cho các nhà nghiên cứu làm việc với họ mô hình Gemma 2.

  • Sử dụng SAE và Trình chuyển mã để phân tích các hành vi nội bộ phức tạp và thuật toán nhiều bước trong Gemma 3.
  • Phân tích các hành vi trò chuyện cụ thể, cơ chế từ chối và độ trung thực của chuỗi suy luận để xây dựng các tác nhân AI an toàn hơn.

Tìm hiểu thêm

Đọc về cấu trúc, dữ liệu huấn luyện và các chức năng mới của Gemma Scope 2.
Truy cập vào các trọng số, mã và tài liệu cho bộ công cụ diễn giải Gemma 3.
Hãy dùng thử hướng dẫn tương tác để hình dung các tính năng và sửa đổi hành vi của mô hình.
Truy cập vào blog và tài nguyên về Gemma Scope ban đầu cho Gemma 2.