Mọi phương pháp sử dụng trí tuệ nhân tạo (AI) có trách nhiệm đều phải bao gồm chính sách an toàn, cấu phần minh bạch và biện pháp bảo vệ. Tuy nhiên, việc sử dụng AI có trách nhiệm không chỉ là việc làm theo danh sách kiểm tra.
Các sản phẩm GenAI còn khá mới và hành vi của ứng dụng có thể khác nhau nhiều hơn so với các dạng phần mềm trước đó. Vì lý do này, bạn nên thăm dò các mô hình đang được sử dụng để kiểm tra các ví dụ về hành vi của mô hình và điều tra các kết quả bất ngờ.
Lời nhắc là một giao diện có mặt khắp nơi để tương tác với AI tạo sinh, và kỹ thuật thì những câu lệnh đó cũng mang tính nghệ thuật và khoa học. Tuy nhiên, có một số có thể giúp bạn cải thiện câu lệnh cho các LLM theo kinh nghiệm, chẳng hạn như Công cụ diễn giải học tập (LIT). LIT là một công cụ nguồn mở để hiểu và gỡ lỗi trực quan các mô hình AI. Công cụ này có thể được dùng làm trình gỡ lỗi cho công việc kỹ thuật nhanh. Hãy đồng hành cùng đã cung cấp hướng dẫn thông qua Colab hoặc Lớp học lập trình.
Phân tích mô hình Gemma bằng LIT
Bắt đầu lớp học lập trình | Khởi động Google Colab |
Hình 1. Giao diện người dùng của LIT: Trình chỉnh sửa điểm dữ liệu ở trên cùng cho phép người dùng chỉnh sửa câu lệnh của họ. Ở dưới cùng, mô-đun LM Salience cho phép họ kiểm tra kết quả nổi bật.
Bạn có thể sử dụng LIT trên máy cục bộ, trong Colab hoặc trên Google Cloud.
Đưa các nhóm không chuyên về kỹ thuật vào quy trình thăm dò và khám phá mô hình
Khả năng diễn giải là một nỗ lực của nhóm, bao gồm các chuyên môn về chính sách, pháp lý và nhiều lĩnh vực khác. Khả năng tương tác và phương tiện hình ảnh của LIT trong việc kiểm tra và tìm hiểu ví dụ có thể giúp các bên liên quan khác nhau chia sẻ và truyền đạt các phát hiện. Phương pháp này có thể mang lại nhiều góc nhìn hơn trong việc khám phá, thăm dò và gỡ lỗi mô hình. Giới thiệu những nội dung này cho các thành viên trong nhóm của bạn các phương pháp kỹ thuật có thể giúp họ nâng cao hiểu biết về cách hoạt động của các mô hình. Ngoài ra, một nhóm chuyên gia đa dạng hơn trong quá trình thử nghiệm mô hình sớm cũng có thể giúp phát hiện những kết quả không mong muốn có thể được cải thiện.