Melhor app geral

Jayu

Um assistente pessoal que integra perfeitamente a API Gemini ao dispositivo de um usuário

O que faz?

O Jayu é um assistente pessoal revolucionário que integra perfeitamente os recursos do Gemini com a interação na tela. Quebrando os limites do que um LLM pode fazer, Jayu usa o Gemini para oferecer uma experiência centrada no usuário, para todos, desde usuários experientes em tecnologia até aqueles que têm dificuldades. Sem contêiner do Docker, sem interface complexa e sem outro LLM ou VLM além do Gemini. Os recursos de reconhecimento de gestos, de fala em texto e de texto em fala são integrados para melhorar a usabilidade.

O ponto forte do Jayu está na capacidade única de responder a comandos com a tela como contexto e interagir com os elementos na tela. Do código escrito com base em um diagrama à interação direta com apps e a leitura de traduções em tempo real, Jayu pode fazer tudo.

Um modelo do Flash é usado como centro de comando. Depois de receber instruções do usuário, o modelo usa a chamada de função para chamar outros modelos do Gemini para ajudar na tarefa, se necessário. Com a engenharia de comandos, os modelos Flash interagem diretamente com o Chrome e respondem a perguntas rápidas, enquanto os modelos Pro são treinados para usar os recursos de visão avançados do Gemini para analisar as janelas do app. E os recursos de detecção de objetos do Gemini permitem que Jayu clique nos botões que aparecem na tela.

Entendemos os riscos de segurança de ter acesso à tela ou aos arquivos. O Jayu não pode acessar pastas ou apps que não são mostrados a ele. O Jayu só vai olhar para a tela se for solicitado diretamente. Ele também não retém nenhuma memória ou registros de imagens ou gravações.

Desenvolvido com

  • Web/Chrome

Equipe

Por

Jayu

De

Estados Unidos