Tworzenie weryfikatora slajdów z AI za pomocą Gemini

Przygotuj, uruchom i dostosuj dodatek do weryfikacji slajdów do Prezentacji Google Workspace za pomocą tego projektu kodu. Niezależnie od tego, czy transmitujesz raz na tydzień czy 1 prezentację, większość z nas przydałaby się odrobina pomocy w jej przygotowaniu. Czy zdarza Ci się zmieścić za dużo na slajdzie? Może zapomniałeś podzielić prezentację na treści wizualne? Możesz nawet przygotować zbiór wytycznych dotyczących skutecznych prezentacji. Czytacie je ostatnio?

Projekt Slides Advisor to dodatek do Google Workspace typu open source, który wykorzystuje technologię sztucznej inteligencji (AI) do przeglądania prezentacji i dodawania do nich opinii w razie potrzeby. Projekt ten korzysta z interfejsu Google Gemini API do przetwarzania obrazów i tekstu, aby analizować Prezentacje Google pod kątem zestawu wytycznych i informować, jak sobie radzisz. Co więcej, możesz dostosować te wskazówki do zaleceń swojej organizacji lub przypomnieć Ci o poprawianiu prezentacji na podstawie reguł, które samodzielnie określisz.

Film z omówieniem projektu i sposobów jego rozwoju, w tym informacji od osób, które go tworzą, znajdziesz w filmie Weryfikator prezentacji AI – Build with Google AI. W przeciwnym razie możesz rozszerzyć projekt, postępując zgodnie z instrukcjami.

Dodatek do programu Prezentacje Google działający jako pasek boczny w Prezentacjach Google Rysunek 1. Dodatek Doradcy Prezentacji do Prezentacji Google uruchomiony jako panel paska bocznego.

Konfigurowanie projektu

Te instrukcje przeprowadzą Cię przez proces konfigurowania projektu doradcy Prezentacji na potrzeby programowania i testowania. Ogólne czynności to utworzenie projektu Google Apps Script, skonfigurowanie projektu Google Cloud pod kątem dostępu do interfejsu API i ustawienie właściwości skryptu w projekcie.

Utwórz projekt Apps Script

Ten projekt w Prezentacjach Google działa jako dodatek do Prezentacji Google. Konfigurujesz projekt za pomocą interfejsu internetowego Prezentacji Google i tworzysz projekt Apps Script zawierający kod.

Aby utworzyć nowy projekt Apps Script:

  1. Otwórz aplikację internetową Prezentacje w Google Workspace.
  2. Otwórz istniejącą prezentację lub utwórz nową.
  3. W Prezentacjach wybierz Rozszerzenia > Apps Script.

Gdy wykonasz te czynności, w internetowym interfejsie użytkownika Apps Script powinieneś mieć nowy projekt bez tytułu dołączony do prezentacji, z której rozpoczęto. Nazwij projekt, aby ułatwić sobie jego znalezienie.

Aby nazwać projekt Apps Script:

  1. W interfejsie internetowym Apps Script kliknij tekst Projekt bez nazwy.
  2. W oknie Zmień nazwę projektu wpisz: My Slides Advisor i wybierz Zmień nazwę.

Przygotuj pliki projektu

Projekt Prezentacji Advisor zawiera 5 plików kodu. Musisz je skonfigurować, zanim skopiujesz kod do nowego projektu Apps Script. Ta sekcja zawiera informacje o tym, jak przygotować projekt i uzyskać kod.

Aby przygotować pliki projektu:

  1. Otwórz interfejs internetowy Apps Script zawierający projekt My Prezentacji Advisor.
  2. W menu po lewej stronie wybierz widok < > Edytor.
  3. Zmień nazwę pliku Code.gs na main.gs. Aby to zrobić, najedź kursorem na nazwę pliku kodu Code.gs i w menu kontekstowym wybierz Zmień nazwę, a następnie wpisz main. Interfejs automatycznie dodaje rozszerzenie .gs.
  4. Ustaw plik manifestu appscript.json jako widoczny. Aby to zrobić, kliknij ikonę koła zębatego (Ustawienia projektu) w menu po lewej stronie, a następnie włącz opcję Pokaż plik manifestu „appscript.json”.
  5. W menu po lewej stronie w interfejsie internetowym Apps Script wybierz widok < > Edytor.
  6. Utwórz plik z kodem ui.gs: kliknij ikonę + (plus) po prawej stronie nagłówka Pliki, wybierz Skrypt i wpisz ui.
  7. Powtórz poprzedni krok, aby utworzyć pliki z kodem slides.gs i ai.gs.

Twój projekt Apps Script powinien teraz zawierać 5 tych plików kodu, które w większości są puste:

  • appscript.json
  • main.gs
  • ui.gs
  • slides.gs
  • ai.gs

W następnym kroku pobierz kod projektu z repozytorium i skopiuj go do projektu Apps Script.

Pobieranie kodu projektu

Kod projektu Prezentacji Advisor jest przechowywany w repozytorium kodu. Aby z nim pracować, musisz skopiować ten kod do projektu Apps Script. W tej sekcji dowiesz się, jak uzyskać kod projektu.

Aby pobrać kod projektu:

  1. Przejdź do repozytorium kodu projektu, aby uzyskać plik manifestu projektu appsscript.json
  2. Skopiuj zawartość tego pliku kodu do schowka.
  3. Wróć do interfejsu internetowego Apps Script, wybierz nazwę pliku appsscript.json i wklej kod w panelu edytora kodu, zastępując wcześniej poprzedni kod.
  4. Powtórz tę procedurę dla pozostałych 4 plików kodu:
    • Skopiuj kod main.js do pliku main.gs.
    • Skopiuj kod ui.js do pliku ui.gs.
    • Skopiuj kod slides.js do pliku slides.gs.
    • Skopiuj kod ai.js do pliku ai.gs.

Połącz projekt Google Cloud

Ten projekt korzysta z projektu Google Cloud, który zapewnia dostęp do modeli Gemini AI. Google Cloud udostępnia określone zasady dotyczące prywatności danych, a także przydatne oprogramowanie do tworzenia aplikacji, takich jak doradca Prezentacji. Aby połączyć kod dodatku z interfejsem Gemini API, musisz utworzyć projekt Cloud z dostępem do interfejsu AI API, utworzyć konto usługi dla projektu, klucz dla konta usługi i zainstalować ten klucz w projekcie dodatku.

Konfigurowanie projektu Cloud

Projekt Cloud, którego używasz do łączenia się z interfejsem Gemini API, musi mieć włączoną usługę Vertex AI API. Musisz utworzyć uwierzytelnione połączenie z tym projektem za pomocą dodatku do Prezentacji Google. Interfejs Vertex AI API wymaga też włączenia płatności w projektach, w których go używasz.

Aby skonfigurować projekt Cloud z dostępem do interfejsu Vertex AI API:

  1. Otwórz konsolę Google Cloud i w razie potrzeby zaloguj się.
  2. W konsoli Google Cloud wybierz istniejący projekt Cloud lub utwórz nowy.
  3. Na stronie Panel projektu w konsoli wybierz w panelu Interfejsy API opcję Przejdź do przeglądu interfejsów API lub wejdź na stronę https://console.cloud.google.com/apis/.
  4. U góry strony Interfejsy API i usługi wybierz + WŁĄCZ INTERFEJSY API I USŁUGI.
  5. Na stronie Biblioteka interfejsów API wyszukaj vertex ai api, wybierz opcję Vertex AI API, a następnie kliknij przycisk Włącz.
  6. Musisz włączyć płatności w projekcie Google Cloud, a następnie włączyć AI, klikając przycisk Włącz na stronie konsoli Vertex AI API.
  7. Sprawdź, czy interfejs Vertex AI API jest włączony. Aby to zrobić, otwórz stronę Interfejsy API i usługi swojego projektu. Na tej stronie powinien być teraz widoczny interfejs API Vertex AI.

Utwórz konto usługi

Dodatek Prezentacji Advisor wymaga uwierzytelnionego połączenia z projektem Cloud, aby uzyskać dostęp do interfejsu Vertex AI API i modeli Gemini. Aby utworzyć to połączenie, najpierw wygeneruj w projekcie Cloud konto usługi, które ma dostęp do interfejsu Vertex AI API. Projekt Prezentacji Advisor łączy się za pomocą tego konta usługi.

Aby utworzyć konto usługi dla dodatku doradcy Prezentacji:

  1. W konsoli Google Cloud otwórz stronę Interfejsy API i usługi swojego projektu Cloud.
  2. W lewej części strony kliknij Dane logowania.
  3. U góry strony wybierz + UTWÓRZ DANE LOGOWANIA > Konto usługi.
  4. Na stronie Utwórz konto usługi w sekcji Szczegóły konta usługi wpisz nazwę konta usługi, identyfikator i opis.
  5. Utwórz konto usługi, wybierając Utwórz i kontynuuj.
  6. W sekcji Przyznaj temu kontu usługi dostęp do projektu wybierz opcję Rola.
  7. W wyszukiwaniu pola Filtr wybierz zestaw uprawnień Użytkownik Vertex AI, a następnie kliknij Dalej.
  8. Dokończ tworzenie tego konta usługi, wybierając Gotowe.

Więcej informacji o tworzeniu kont usługi znajdziesz w dokumentacji tworzenia kont usługi w Google Cloud.

Utwórz i zainstaluj klucz konta usługi

Projekt Prezentacji Advisor musi mieć możliwość uwierzytelnienia na koncie usługi utworzonym w ramach poprzedniej procedury. Aby włączyć to uwierzytelnianie, utwórz klucz dla konta usługi i skonfiguruj go w projekcie Apps Script Prezentacji Doradcy jako właściwość skryptu. Poniżej opisano, jak utworzyć klucz i skonfigurować go w projekcie.

Aby utworzyć i skonfigurować klucz konta usługi:

  1. W konsoli Google Cloud otwórz stronę Interfejsy API i usługi swojego projektu Cloud.
  2. W lewej części strony kliknij Dane logowania.
  3. W sekcji Konta usługi odszukaj utworzone konto usługi, wybierz adres e-mail konta lub ikonę ołówka, aby je edytować.
  4. W oknie edycji konta usługi u góry strony wybierz tytuł karty KLUCZE.
  5. W sekcji Klucze wybierz Dodaj klucz > Utwórz nowy klucz.
  6. W oknie Utwórz klucz prywatny dla... wybierz JSON i kliknij Utwórz. Zostanie utworzony plik klucza o nazwie projectid-hashcode.json i automatycznie pobierze go na Twój komputer.
  7. Otwórz pobrany plik projectid-hashcode.json i skopiuj jego zawartość.
  8. Otwórz interfejs internetowy Apps Script zawierający projekt My Prezentacji Advisor i w menu po lewej stronie wybierz widok Settings (Ustawienia).
  9. W sekcji Właściwości skryptu kliknij kolejno przyciski Edytuj właściwości skryptu i Dodaj właściwość skryptu.
  10. W nowym polu Usługa wpisz SERVICE_ACCOUNT_KEY, a w polu Wartość skopiuj zawartość pobranego pliku projectid-hashcode.json.
  11. Zapisz nową właściwość, klikając przycisk Zapisz właściwości skryptu.

Więcej informacji o tworzeniu kluczy konta usługi znajdziesz w dokumentacji Google Cloud tworzenia i usuwania kluczy konta usługi.

Testowanie projektu dodatku

Panel slajdów Google Workspace z ikoną Doradcy Prezentacji Testowanie projektu Prezentacje Google wymaga utworzenia testowego wdrożenia kodu dodatku i zainstalowania tego wdrożenia testowego. W tej konfiguracji projekt jest dostępny tylko w prezentacji Google, w której uruchomiono dodatek Apps Script w projekcie, i w żadnych innych prezentacjach. Więcej informacji o wdrażaniu dodatku, aby zwiększyć jego zasięg, znajdziesz w dokumentacji Google Workspace Apps Script w temacie Tworzenie wdrożeń i zarządzanie nimi.

Aby wdrożyć i przetestować kod projektu Apps Script:

  1. U góry interfejsu internetowego Apps Script wybierz Wdróż > Testuj wdrożenia.
  2. W oknie Testuj wdrożenia obok opcji Wybierz typ kliknij ikonę koła zębatego i Dodatek do Google Workspace.
  3. Obok aplikacji: tytuł prezentacji, kliknij przycisk Zainstaluj.
  4. pozostaw domyślne ustawienia opcji Testuj najnowszy kod i kliknij Gotowe.
  5. poruszaj się po prezentacji Google połączonej z projektem Apps Script i załaduj ponownie stronę internetową;
  6. W prawym dolnym rogu aplikacji internetowej Prezentacje kliknij ikonę <, aby otworzyć panel boczny, a następnie kliknij ikonę czarno-białego oka, aby otworzyć panel doradcy Prezentacji.

Gdy wykonasz ten krok i uruchomisz dodatek, możesz zacząć go modyfikować, aby stosować inne wskazówki lub realizować inny przepływ pracy. W kolejnych sekcjach znajdziesz instrukcje wprowadzania podstawowych zmian do dodatku do usługi Prezentacji Google.

Zmiana sposobu sprawdzania

Możesz zmieniać sposób sprawdzania przez doradcę Prezentacji, zarówno pod względem danych wyjściowych z interfejsu Gemini API, jak i interfejsu udostępnianego przez dodatek, modyfikując kod projektu. Ten samouczek dotyczy zmiany instrukcji dotyczących promptów w celu modyfikacji działania przeglądania slajdu prezentacji. Więcej informacji o rozszerzaniu interfejsu Prezentacji Google przy użyciu Apps Script znajdziesz w artykule o rozszerzaniu Prezentacji Google.

Zmień wytyczne dotyczące sprawdzania

Doradca Prezentacji zawiera podstawowy zestaw wskazówek dotyczących sprawdzania slajdów, w tym kategorie uproszczenia, koloru, typografii, struktury i pustego obszaru oraz grafiki i ikon. Wskazówki dotyczące sprawdzania to instrukcje tekstowe dołączane w prompcie przez interfejs Gemini API wraz z migawką wybranego slajdu i notatek prelegenta.

Możesz zmienić sposób sprawdzania dodatku, zmieniając instrukcje tekstowe. Możesz na przykład polecić model Gemini, aby zwracał opinię z oceną kategorii w tym samym wierszu co nagłówek kategorii, lub zmienić jej nazwę.

Aby zmienić lokalizację oceny kategorii i jej nazwę:

  1. Otwórz interfejs internetowy Apps Script zawierający projekt My Prezentacji Advisor. W razie potrzeby przejdź do okna projektu, otwierając prezentację w Prezentacjach Google zawierającą projekt Apps Script i wybierając Rozszerzenia > Apps Script.
  2. W menu po lewej stronie wybierz widok < > Edytor, a następnie kliknij nazwę pliku ai.gs.
  3. W pliku z kodem ai.gs znajdź stałą ciąg znaków SYSTEM_PROMPT i zmodyfikuj instrukcje w ten sposób, dodając pogrubiony tekst:
    const SYSTEM_PROMPT = `
    ...
    For each of the following categories evaluate the given slide. Score each
    category on a scale of 0 to 100, show the score next to the category heading,
    and concisely explain the reasoning. Do not suggest improvements if the score
    is 80 or above.
  4. W tej samej stałej ciągu SYSTEM_PROMPT zmień tekst kategorii Simplicity na Message:
    const SYSTEM_PROMPT = `
    ...
    * Message -- Slides should focus on one main idea per slide and ...
    
  5. Zapisz zmiany w pliku kodu ai.gs.
  6. Przejdź do prezentacji Google połączonej z projektem Apps Script, załaduj ponownie stronę internetową i przetestuj zmiany wprowadzone w dodatku, uruchamiając go jeszcze raz.

Jeśli nie masz jeszcze skonfigurowanego wdrożenia testowego dodatku do Prezentacji, wykonaj czynności opisane w artykule Testowanie projektu dodatku.

Możesz usunąć, zastąpić lub przepisać instrukcje dotyczące kategorii opinii w stałej ciągu SYSTEM_PROMPT, aby dostosować ją do wymagań dotyczących opinii. Jeśli chcesz wypróbować różne podejścia do prośby o sprawdzenie lub napisać cały komunikat o recenzji od nowa, skorzystaj z aplikacji internetowej Google AI Studio. Ta aplikacja umożliwia prototypowanie, testowanie i zapisywanie promptów dla Gemini w wygodnym interfejsie. Wykorzystuje ona ten sam interfejs Gemini API co projekt Prezentacji Advisor. Więcej informacji o korzystaniu z AI Studio znajdziesz w krótkim przewodniku dotyczącym AI Studio.

Zmień konfigurację zachowania modelu

Interfejs Gemini API udostępnia kilka ustawień do zmiany ogólnego działania modelu w odpowiedzi na prośbę o żądanie. W szczególności ustawienie temperatury modelu pozwala określić, jak bardzo zmienność jest dozwolona w odpowiedzi przez model – 0 oznacza najniższą wartość, a 1 – najwyższą. Ustawienie tej wartości na 0,1 daje bardzo spójne odpowiedzi, ale takie zachowanie może wydawać się powtarzalne i mniej przydatne dla użytkowników otrzymujących opinie o opiniach. Rozważ ustawienie wyższej wartości temperatury. Pamiętaj też, że im wyższa temperatura, tym bardziej niespójne mogą być uzyskane wyniki. Może to np. obejmować odmienne implementowanie instrukcji, a nawet całkowite ignorowanie niektórych instrukcji.

Aby zwiększyć temperaturę odpowiedzi na opinie:

  1. Otwórz interfejs internetowy Apps Script zawierający projekt My Prezentacji Advisor.
  2. W menu po lewej stronie wybierz widok < > Edytor, a następnie kliknij nazwę pliku ai.gs.
  3. W pliku kodu ai.gs znajdź funkcję analyzeSlides() i zmień stałą generationConfig, ustawiając wartość temperature na 0.3:

    function analyzeSlides(slide) {
    
        const generationConfig = {
            temperature: 0.3,
            maxOutputTokens: 1024 * 2,
        };
    
  4. Zapisz zmiany w pliku kodu ai.gs.

  5. Przejdź do prezentacji Google połączonej z projektem Apps Script, załaduj ponownie stronę internetową i przetestuj zmiany wprowadzone w dodatku, uruchamiając go jeszcze raz.

Więcej informacji o ustawieniach konfiguracji zachowania modelu znajdziesz w dokumentacji interfejsu Gemini API dotyczącej GenerationConfig.

Dodatkowe materiały

Więcej informacji o projekcie Prezentacji Advisor znajdziesz w repozytorium kodu. Jeśli potrzebujesz pomocy w tworzeniu aplikacji lub chcesz współpracować z innymi programistami, odwiedź serwer Google Developers Community Discord. Aby obejrzeć więcej projektów AI w ramach usługi Build with Google, obejrzyj playlistę wideo.