رابط برنامهنویسی پایتون LiteRT-LM برای لینوکس و macOS (پشتیبانی از ویندوز در راه است). ویژگیهایی مانند چندوجهی بودن و استفاده از ابزارها پشتیبانی میشوند، در حالی که شتابدهی با GPU در راه است.
مقدمه
در اینجا یک نمونه برنامه چت ترمینال ساخته شده با API پایتون آورده شده است:
import litert_lm
litert_lm.set_min_log_severity(litert_lm.LogSeverity.ERROR) # Hide log for TUI app
with litert_lm.Engine("path/to/model.litertlm") as engine:
with engine.create_conversation() as conversation:
while True:
user_input = input("\n>>> ")
for chunk in conversation.send_message_async(user_input):
print(chunk["content"][0]["text"], end="", flush=True)

شروع به کار
LiteRT-LM به عنوان یک کتابخانه پایتون در دسترس است. میتوانید نسخه شبانه آن را از PyPI نصب کنید:
# Using pip
pip install litert-lm-api-nightly
# Using uv
uv pip install litert-lm-api-nightly
۱. موتور را مقداردهی اولیه کنید
Engine نقطه ورود به API است. بارگذاری مدل و مدیریت منابع را مدیریت میکند. استفاده از آن به عنوان مدیر زمینه (context manager) (با دستور with ) تضمین میکند که منابع بومی (native resources) به سرعت منتشر شوند.
توجه: مقداردهی اولیه موتور برای بارگذاری مدل میتواند چند ثانیه طول بکشد.
import litert_lm
# Initialize with the model path and optionally specify the backend.
# backend can be Backend.CPU (default). GPU support is upcoming.
with litert_lm.Engine(
"path/to/your/model.litertlm",
backend=litert_lm.Backend.CPU,
# Optional: Pick a writable dir for caching compiled artifacts.
# cache_dir="/tmp/litert-lm-cache"
) as engine:
# ... Use the engine to create a conversation ...
pass
۲. یک مکالمه ایجاد کنید
یک Conversation وضعیت و تاریخچه تعامل شما با مدل را مدیریت میکند.
# Optional: Configure system instruction and initial messages
messages = [
{"role": "system", "content": [{"type": "text", "text": "You are a helpful assistant."}]},
]
# Create the conversation
with engine.create_conversation(messages=messages) as conversation:
# ... Interact with the conversation ...
pass
۳. ارسال پیام
شما میتوانید پیامها را به صورت همزمان یا غیرهمزمان (استریمینگ) ارسال کنید.
مثال همگام:
# Simple string input
response = conversation.send_message("What is the capital of France?")
print(response["content"][0]["text"])
# Or with full message structure
# response = conversation.send_message({"role": "user", "content": "..."})
مثال ناهمزمان (استریمینگ):
# sendMessageAsync returns an iterator of response chunks
stream = conversation.send_message_async("Tell me a long story.")
for chunk in stream:
# Chunks are dictionaries containing pieces of the response
for item in chunk.get("content", []):
if item.get("type") == "text":
print(item["text"], end="", flush=True)
print()
۴. چندوجهی بودن
# Initialize with vision and/or audio backends if needed
with litert_lm.Engine(
"path/to/multimodal_model.litertlm",
audio_backend=litert_lm.Backend.CPU,
# vision_backend=litert_lm.Backend.CPU, (GPU support is upcoming)
) as engine:
with engine.create_conversation() as conversation:
user_message = {
"role": "user",
"content": [
{"type": "audio", "path": "/path/to/audio.wav"},
{"type": "text", "text": "Describe this audio."},
],
}
response = conversation.send_message(user_message)
print(response["content"][0]["text"])
۵. تعریف و استفاده از ابزارها
شما میتوانید توابع پایتون را به عنوان ابزارهایی تعریف کنید که مدل میتواند به طور خودکار آنها را فراخوانی کند.
def add_numbers(a: float, b: float) -> float:
"""Adds two numbers.
Args:
a: The first number.
b: The second number.
"""
return a + b
# Register the tool in the conversation
tools = [add_numbers]
with engine.create_conversation(tools=tools) as conversation:
# The model will call add_numbers automatically if it needs to sum values
response = conversation.send_message("What is 123 + 456?")
print(response["content"][0]["text"])
LiteRT-LM از رشته سند و نکات نوع تابع برای تولید طرحواره ابزار برای مدل استفاده میکند.