Aplikacja do nauki oparte na AI od YouTube
testować się, streszczać i prowadzić czaty z filmami w YouTube;
Działanie
Moja aplikacja, która została opracowana w języku React Native, umożliwia tworzenie quizów na podstawie filmów w YouTube, prowadzenie czatu na podstawie transkrypcji filmu oraz wyświetlanie inteligentnego podsumowania, które można kliknąć i odtworzyć w różnych punktach.
Do inteligentnego podsumowania użyto Gemini, tworząc prompt, który akceptuje transkrypcję z oznaczeniem czasu w formacie MM:SS. Tutaj zdefiniowałem schemat JSON, którego oczekuję od Gemini. Okazało się, że jest bardzo niezawodne i można go użyć do przeanalizowania oczekiwanego wyniku w opracowanej przeze mnie aplikacji w języku React Native, korzystając z tych sygnatur MM:SS w miejscach, w których należy przesunąć odtwarzacz w aplikacji YouTube do właściwego momentu. Długie okno kontekstowe Gemini było kluczowe. Bez problemu poradził sobie z 5-godzinnym transkryptem filmu.
Podobnie w przypadku ekranu pytań i odpowiedzi po eksperymentowaniu z różnymi promptami i schematami JSON zdecydowałem się na pytanie wielokrotnego wyboru i odpowiedź, które Gemini zwrócił z poprawną odpowiedzią. Dzięki temu mogłem użyć odpowiedzi w formacie JSON do utworzenia interaktywnego pytania jednokrotnego wyboru opartego wyłącznie na transkrypcji filmu. Bez Gemini byłoby to trudne. Wprowadziliśmy też odświeżanie w przypadku różnych liczb pytań i odpowiedzi.
Wprowadziliśmy też kartę czatu, na której możemy rozmawiać z transkrypcją filmu i zadawać pytania, które nas nurtują, gdy oglądamy film i chcemy dowiedzieć się więcej. Wykorzystano w tym celu potężną wiedzę, która już istniała w gemini, oraz kontekst transkrypcji filmu.
Wykorzystano też bazę danych, funkcje i hosting Firebase.
Utworzone za pomocą
- Android
- Wersja internetowa/Chrome
- Firebase
- Prośba Gemini AI
Zespół
Autor:
David Joyce
Od
Australia