Cognitive Strike

Gemini의 향상된 영상 통화로 모든 시나리오에 맞는 기술을 완성하세요.

기능

이 앱은 Gemini를 사용하여 다양한 시나리오에 대한 준비를 혁신하는 것을 목표로 합니다. 이 기능은 사실적인 동영상 상호작용을 시뮬레이션하도록 설계되었습니다. Google은 특정 사용자의 요구사항에 맞춰 모의 세션을 맞춤설정하고 사용자가 인터뷰를 준비할 수 있도록 지원하도록 시스템 역할을 미세 조정했습니다.

이 앱에는 채팅 모드와 동영상 모드라는 두 가지 동적 모드가 있습니다. 채팅 모드에서는 사용자가 맞춤설정된 Gemini 인터뷰어와 대화한 후 해당 대화에서 생성된 맞춤 퀴즈를 풀 수 있습니다. 동영상 모드는 Google Cloud TTS 및 webSTT를 활용하여 사용자와의 실시간 영상 통화를 시뮬레이션합니다. 이 모델은 사용자의 동영상 피드를 비동기식으로 업로드하고 모델이 보는 내용과 사용자가 말하는 내용을 기반으로 Gemini에서 동적 응답을 생성합니다.

PS - 여기서 사용되는 유일한 LLM API는 Gemini입니다. 다른 API는 Google Cloud Text-to-Speech입니다.

구성용 제품

  • Chromium 및 Google Cloud Text-to-Speech

작성자:

Automa

From

인도