Presentamos Google AI Edge Portal: Compara la IA de Edge a gran escala. Regístrate para solicitar acceso durante la vista previa privada.

Google uses AI technology to translate content into your preferred language. AI translations can contain errors.

API web de LiteRT-LM

Es la API web de LiteRT-LM para JavaScript y TypeScript en el navegador. Esta es una versión preliminar que admite la ejecución de texto de entrada y salida en WebGPU.

Introducción

Aquí tienes una app de chat de REPL de ejemplo compilada con la API de JavaScript:

<div id="out" style="white-space: pre-wrap; font-family: monospace;"></div>
<input id="in" onkeydown="if(event.key === 'Enter') repl(this)">

<script type="module">
  import { Engine } from 'https://cdn.jsdelivr.net/npm/@litert-lm/core/+esm';
  const engine = await Engine.create({ model: '/path/to/model.litertlm' });
  const chat = await engine.createConversation();

  window.repl = async (el) => {
    const text = el.value;
    el.value = ''; // Clear immediately
    out.append(`\n>>> ${text}\nAI: `);

    for await (const chunk of chat.sendMessageStreaming(text)) {
      out.append(chunk.content[0].text);
    }
  };
</script>

Comenzar

LiteRT-LM está disponible como un paquete npm. Puedes instalar la versión más reciente desde npm o importarla directamente desde una CDN:

# From npm
npm i --save @litert-lm/core

# From a CDN (in your JavaScript file)
import * as litertlm from 'https://cdn.jsdelivr.net/npm/@litert-lm/core/+esm';

Inicializa el motor

Engine es el punto de entrada a la API. Se encarga de la carga del modelo, la creación de sesiones y la administración de recursos. Recuerda delete el motor para liberar recursos cuando ya no se necesite el modelo.

Nota: La inicialización del motor puede tardar varios segundos en cargar el modelo.

import {Engine, EngineSettings} from '@litert-lm/core';

const engineSettings = {
  model: 'url/path/to/model.litertlm', // or a ReadableStream, or a Blob
} satisfies EngineSettings;

const engine = await Engine.create(engineSettings);

// ... Use the engine to create a conversation ...

// Delete the engine when done.
await engine.delete();

Cómo crear una conversación

Una vez que se inicializa el motor, crea una instancia de Conversation. Puedes proporcionar un ConversationConfig para personalizar su comportamiento.

const conversation = await engine.createConversation({
  preface: {
    messages: [
      {role: 'system', content: 'You are a helpful assistant'}
    ]
  }
});

conversation.sendMessage({
  role: 'user',
  content: 'Write a poem',
});

Enviar mensajes

Puedes enviar mensajes con o sin transmisión.

Ejemplo de Non-Streaming

// Simple string input
let response = await conversation.sendMessage("What is the capital of France?");
console.log(response.content[0].text);

// Or with full message structure
response = await conversation.sendMessage({role: 'user', content: '...'});

Ejemplo de transmisión

// sendMessageStreaming returns a ReadableStream of response chunks
const stream = conversation.sendMessageStreaming('Tell me a long story.');

for await (const chunk of stream) {
  // Chunks are Records containing pieces of the response
  for (const item of chunk.content) {
    if (item.type === 'text') {
      console.log(item.text);
    }
  }
}

Cancelar la generación

Puedes cancelar una generación en curso de forma explícita llamando a cancel() en la instancia de Conversation:

// Cancel any ongoing generation
conversation.cancel();

Si transmites la respuesta, salir del bucle for await...of antes de tiempo (por ejemplo, con break) también cancelará automáticamente la generación en curso:

for await (const chunk of stream) {
  if (shouldStop()) {
    break; // Cancels the stream and underlying generation
  }
}