O EmbeddingGemma é um modelo de embedding de texto multilíngue de 308 milhões de parâmetros baseado no Gemma 3. Ele é otimizado para uso em dispositivos do dia a dia, como smartphones, laptops e tablets. O modelo produz representações numéricas de texto para serem usadas em tarefas downstream, como recuperação de informações, pesquisa de similaridade semântica, classificação e clustering.
O EmbeddingGemma inclui os seguintes recursos principais:
- Suporte multilíngue: compreensão de dados linguísticos abrangente, treinada em mais de 100 idiomas.
- Dimensões de saída flexíveis: personalize as dimensões de saída de 768 a 128 para compensações de velocidade e armazenamento usando o aprendizado de representação de Matryoshka (MRL, na sigla em inglês).
- Contexto de token de 2K: contexto de entrada substancial para processar dados de texto e documentos diretamente no hardware.
- Eficiência de armazenamento: execute com menos de 200 MB de RAM com quantização
- Baixa latência: incorporações generativas em menos de 22 ms na EdgeTPU para aplicativos rápidos e fluidos.
- Off-line e seguro: gere incorporações de documentos diretamente no hardware. Funciona sem conexão de Internet para manter os dados sensíveis seguros.
Acesse no Hugging Face Acesse no Kaggle Acesse no Vertex
Assim como outros modelos do Gemma, o EmbeddingGemma é fornecido com pesos abertos e licenciado para uso comercial responsável, permitindo que você faça o ajuste fino e a implantação nos seus próprios projetos e aplicativos.