Um assistente pessoal que integra perfeitamente a API Gemini ao dispositivo de um usuário
O que faz?
O Jayu é um assistente pessoal revolucionário que integra perfeitamente os recursos do Gemini à interação na tela. Quebrando os limites do que um LLM pode fazer, Jayu usa o Gemini para oferecer uma experiência centrada no usuário, para todos, desde usuários experientes em tecnologia até aqueles que têm dificuldades. Sem contêiner do Docker, sem interface complexa e sem outro LLM ou VLM além do Gemini. Os recursos de reconhecimento de fala, de texto em voz e de gestos são integrados para melhorar a usabilidade.
O ponto forte do Jayu está na capacidade única de responder a comandos com a tela como contexto e interagir com os elementos na tela. Do código escrito com base em um diagrama à interação direta com apps e à leitura de traduções em tempo real, Jayu pode fazer tudo.
Um modelo Flash é usado como centro de comando. Depois de receber instruções do usuário, o modelo usa a chamada de função para chamar outros modelos do Gemini e ajudar na tarefa, se necessário. Com a engenharia de comando, os modelos Flash interagem diretamente com o Chrome e respondem a perguntas rápidas, enquanto os modelos Pro são treinados para usar os recursos de visão avançados do Gemini para analisar janelas de apps. E os recursos de detecção de objetos do Gemini permitem que o Jayu clique nos botões que aparecem na tela.
Sabemos dos riscos de segurança de ter acesso à tela ou aos arquivos. O Jayu não pode acessar pastas ou apps que não são mostrados a ele. O Jayu só vai olhar para a tela se for solicitado diretamente. Ele também não retém nenhuma memória ou registros de imagens ou gravações.
[[["Fácil de entender","easyToUnderstand","thumb-up"],["Meu problema foi resolvido","solvedMyProblem","thumb-up"],["Outro","otherUp","thumb-up"]],[["Não contém as informações de que eu preciso","missingTheInformationINeed","thumb-down"],["Muito complicado / etapas demais","tooComplicatedTooManySteps","thumb-down"],["Desatualizado","outOfDate","thumb-down"],["Problema na tradução","translationIssue","thumb-down"],["Problema com as amostras / o código","samplesCodeIssue","thumb-down"],["Outro","otherDown","thumb-down"]],[],[],[],null,["# Jayu\n\n[See all winners](/competition#w-0) \nBest Overall app \n\nJayu\n====\n\nA personal assistant that seamlessly integrates the Gemini API with a user's device \nWhat it does\n\nJayu is a revolutionary personal assistant that seamlessly integrates Gemini's capabilities with on-screen interaction. Breaking the limits of what an LLM should be able to do, Jayu utilizes Gemini to provide a user-centered experience, for everyone from tech-savvy users to the technologically challenged. No docker container, no complex interface, and no other LLM or VLM besides Gemini. Speech-to-text, text-to-speech, and gesture recognition capabilities are built in for usability. \n\nJayu's strength lies in its unique ability to answer prompts with your screen as context and interact with on-screen elements. From writing code based on a diagram to directly interacting with apps to reading out live translations, Jayu can do it all. \n\nA Flash model is used as the command center. After receiving instructions from the user, the model uses function calling to call other Gemini models to assist with its task if necessary. Through prompt engineering, Flash models interact directly with Chrome and answer quick questions, while Pro models are trained to use Gemini's powerful vision capabilities to analyze app windows. And Gemini's object detection capabilities allow Jayu to click buttons it sees on the screen. \n\nWe realize the security risks of having access to your screen or files; Jayu cannot access folders or any apps that are not shown to it. Jayu will only look at your screen if directly prompted to do so. Jayu also does not retain any memory or logs of images or recordings. \nBuilt with\n\n- Web/Chrome \nTeam \nBy\n\nJayu \nFrom\n\nUnited States \nMore winners \n[Everies\nBest use of ARCore app](/competition/projects/everies) [ViddyScribe\nBest Web app](/competition/projects/viddyscribe) \n[](/competition)"]]