Presentamos Google AI Edge Portal: Compara la IA de Edge a gran escala. Regístrate para solicitar acceso durante la vista previa privada.

Google uses AI technology to translate content into your preferred language. AI translations can contain errors.

API web de LiteRT-LM

La API web de LiteRT-LM para JavaScript y TypeScript en el navegador. Esta es una versión preliminar que admite la ejecución de texto de entrada y salida en WebGPU.

Modelos compatibles

Actualmente, la API de LiteRT-LM JS admite un conjunto limitado de modelos compatibles con la Web. Estamos trabajando para expandir esto y cubrir archivos de modelos .litertlm generales, pero, por ahora, se admiten los siguientes modelos:

gemma-4-E2B-it-web.litertlm de litert-community/gemma-4-E2B-it-litert-lm
gemma-4-E4B-it-web.litertlm de litert-community/gemma-4-E4B-it-litert-lm

Introducción

Aquí tienes una app de chat REPL de muestra compilada con la API de JavaScript:

<div id="out" style="white-space: pre-wrap; font-family: monospace;"></div>
<input id="in" onkeydown="if(event.key === 'Enter') repl(this)">

<script type="module">
  import { Engine } from 'https://cdn.jsdelivr.net/npm/@litert-lm/core/+esm';
  const engine = await Engine.create({
    // Load the Gemma 4 E2B model
    model: 'https://huggingface.co/litert-community/gemma-4-E2B-it-litert-lm/resolve/main/gemma-4-E2B-it-web.litertlm'
    // Or use the E4B model by swapping in this line
    // model: 'https://huggingface.co/litert-community/gemma-4-E4B-it-litert-lm/resolve/main/gemma-4-E4B-it-web.litertlm'
  });
  const chat = await engine.createConversation();

  window.repl = async (el) => {
    const text = el.value;
    el.value = ''; // Clear immediately
    out.append(`\n>>> ${text}\nAI: `);

    for await (const chunk of chat.sendMessageStreaming(text)) {
      out.append(chunk.content[0].text);
    }
  };
</script>

Comenzar

LiteRT-LM está disponible como un paquete npm. Puedes instalar la versión más reciente desde npm o importarla directamente desde una CDN:

# From npm
npm i --save @litert-lm/core

# From a CDN (in your JavaScript file)
import * as litertlm from 'https://cdn.jsdelivr.net/npm/@litert-lm/core/+esm';

Inicializa el motor

Engine es el punto de entrada a la API. Controla la carga del modelo, la creación de sesiones y la administración de recursos. Recuerda delete el motor para liberar recursos cuando ya no se necesite el modelo.

Nota: La inicialización del motor puede tardar varios segundos en cargar el modelo.

import {Engine, EngineSettings} from '@litert-lm/core';

const engineSettings = {
  model: 'url/path/to/model.litertlm', // or a ReadableStream, or a Blob

  // You can configure context length and other settings here
  mainExecutorSettings: {
    maxNumTokens: 8192,
  },
} satisfies EngineSettings;

const engine = await Engine.create(engineSettings);

// ... Use the engine to create a conversation ...

// Delete the engine when done.
await engine.delete();

Crea una conversación

Una vez que se inicializa el motor, crea una instancia de Conversation. Puedes proporcionar un ConversationConfig para personalizar su comportamiento.

const conversation = await engine.createConversation({
  preface: {
    messages: [
      {role: 'system', content: 'You are a helpful assistant'}
    ]
  }
});

conversation.sendMessage({
  role: 'user',
  content: 'Write a poem',
});

Enviar mensajes

Puedes enviar mensajes con o sin transmisión.

Ejemplo sin transmisión

// Simple string input
let response = await conversation.sendMessage("What is the capital of France?");
console.log(response.content[0].text);

// Or with full message structure
response = await conversation.sendMessage({role: 'user', content: '...'});

Ejemplo de transmisión

// sendMessageStreaming returns a ReadableStream of response chunks
const stream = conversation.sendMessageStreaming('Tell me a long story.');

for await (const chunk of stream) {
  // Chunks are Records containing pieces of the response
  for (const item of chunk.content) {
    if (item.type === 'text') {
      console.log(item.text);
    }
  }
}

Cancelar generación

Puedes cancelar una generación en curso de forma explícita llamando a cancel() en la instancia de Conversation:

// Cancel any ongoing generation
conversation.cancel();

Si transmites la respuesta, salir del bucle for await...of antes de tiempo (por ejemplo, con break) también cancelará automáticamente la generación en curso:

for await (const chunk of stream) {
  if (shouldStop()) {
    break; // Cancels the stream and underlying generation
  }
}