डिवाइस पर अनुमान लगाने के लिए, PyTorch के GenAI मॉडल को बदलना

LiteRT Torch Generative API, परफ़ॉर्मेंस को बेहतर बनाने वाली लाइब्रेरी है. इसे ट्रांसफ़ॉर्मर पर आधारित PyTorch मॉडल को LiteRT/LiteRT-LM फ़ॉर्मैट में लिखने और बदलने के लिए डिज़ाइन किया गया है. इससे डेवलपर, जनरेटिव एआई मॉडल को आसानी से डिप्लॉय कर सकते हैं. खास तौर पर, लार्ज लैंग्वेज मॉडल (एलएलएम) को डिवाइस पर टेक्स्ट और इमेज जनरेट करने के लिए डिप्लॉय किया जा सकता है.

Torch Generative API, सीपीयू और जीपीयू पर मॉडल कन्वर्ज़न को सपोर्ट करता है. साथ ही, एनपीयू पर मॉडल कन्वर्ज़न की सुविधा अभी डेवलपमेंट के चरण में है. Torch Generative API को LiteRT-LM के साथ जोड़कर, रिस्पॉन्सिव और निजता पर फ़ोकस करने वाले ऐप्लिकेशन बनाए जा सकते हैं. ये ऐप्लिकेशन, जनरेटिव मॉडल को पूरी तरह से डिवाइस पर चलाते हैं.

ज़्यादा जानकारी के लिए, Generative Torch API GitHub repo देखें.