ขอแนะนํา Google AI Edge Portal: เปรียบเทียบประสิทธิภาพ AI บนอุปกรณ์ขอบในวงกว้าง ลงชื่อสมัครใช้เพื่อขอสิทธิ์เข้าถึงในช่วงเวอร์ชันตัวอย่างก่อนเปิดตัว

ผสานรวมเครื่องมือฝังข้อความ

โปรแกรมฝังข้อความช่วยให้ฝังข้อความลงในเวกเตอร์ฟีเจอร์แบบหลายมิติ ซึ่งแสดงถึงความหมายเชิงความหมายของข้อความนั้นๆ จากนั้นจึงนำไปเปรียบเทียบกับเวกเตอร์ฟีเจอร์ ของข้อความอื่นๆ เพื่อประเมินความคล้ายคลึงกันเชิงความหมาย

ซึ่งต่างจากการค้นหาข้อความ Text Embedder ช่วยให้คำนวณ ความคล้ายคลึงกันระหว่างข้อความได้ทันทีแทนที่จะค้นหาผ่านดัชนีที่กำหนดไว้ล่วงหน้าซึ่งสร้างจากคลังข้อความ

ใช้ Task Library TextEmbedder API เพื่อติดตั้งใช้งานโปรแกรมฝังข้อความที่กำหนดเองใน แอปบนอุปกรณ์เคลื่อนที่

ฟีเจอร์หลักของ TextEmbedder API

การประมวลผลข้อความอินพุต รวมถึงการสร้างโทเค็น Wordpiece หรือ Sentencepiece ในกราฟหรือนอกกราฟในข้อความอินพุต
ฟังก์ชันยูทิลิตีในตัวเพื่อคำนวณความคล้ายกันของโคไซน์ระหว่างเวกเตอร์ฟีเจอร์

โมเดลโปรแกรมฝังข้อความที่รองรับ

เรารับประกันว่ารุ่นต่อไปนี้จะใช้ได้กับ TextEmbedder API

โมเดล Universal Sentence Encoder TFLite จาก TensorFlow Hub
โมเดลที่กำหนดเองซึ่งเป็นไปตามข้อกำหนดด้านความเข้ากันได้ของโมเดล

เรียกใช้การอนุมานใน C++

// Initialization.
TextEmbedderOptions options:
options.mutable_base_options()->mutable_model_file()->set_file_name(model_path);
std::unique_ptr<TextEmbedder> text_embedder = TextEmbedder::CreateFromOptions(options).value();

// Run inference with your two inputs, `input_text1` and `input_text2`.
const EmbeddingResult result_1 = text_embedder->Embed(input_text1);
const EmbeddingResult result_2 = text_embedder->Embed(input_text2);

// Compute cosine similarity.
double similarity = TextEmbedder::CosineSimilarity(
    result_1.embeddings[0].feature_vector()
    result_2.embeddings[0].feature_vector());

ดูตัวเลือกเพิ่มเติมในการกำหนดค่า TextEmbedder ได้ในซอร์สโค้ด

เรียกใช้การอนุมานใน Python

ขั้นตอนที่ 1: ติดตั้งแพ็กเกจ Pypi สำหรับการรองรับ TensorFlow Lite

คุณสามารถติดตั้งแพ็กเกจ TensorFlow Lite Support Pypi ได้โดยใช้คำสั่งต่อไปนี้

pip install tflite-support

ขั้นตอนที่ 2: การใช้โมเดล

from tflite_support.task import text

# Initialization.
text_embedder = text.TextEmbedder.create_from_file(model_path)

# Run inference on two texts.
result_1 = text_embedder.embed(text_1)
result_2 = text_embedder.embed(text_2)

# Compute cosine similarity.
feature_vector_1 = result_1.embeddings[0].feature_vector
feature_vector_2 = result_2.embeddings[0].feature_vector
similarity = text_embedder.cosine_similarity(
    result_1.embeddings[0].feature_vector, result_2.embeddings[0].feature_vector)

ดูตัวเลือกเพิ่มเติมในการกำหนดค่า TextEmbedder ได้ในซอร์สโค้ด

ตัวอย่างผลการแข่ง

ความคล้ายกันของโคไซน์ระหว่างเวกเตอร์ฟีเจอร์ที่ทำให้เป็นมาตรฐานจะแสดงผลคะแนนระหว่าง -1 ถึง 1 ยิ่งสูงยิ่งดี กล่าวคือ ความคล้ายคลึงกันของโคไซน์ที่ 1 หมายความว่าเวกเตอร์ 2 ตัวเหมือนกัน

Cosine similarity: 0.954312

ลองใช้เครื่องมือเดโม CLI แบบง่ายสำหรับ TextEmbedder กับโมเดลและข้อมูลทดสอบของคุณเอง

ข้อกำหนดความเข้ากันได้ของโมเดล

TextEmbedder API คาดหวังโมเดล TFLite ที่มีข้อมูลเมตาของโมเดล TFLite ที่จำเป็น

ระบบรองรับโมเดล 3 ประเภทหลักๆ ดังนี้

โมเดลที่ใช้ BERT (ดูรายละเอียดเพิ่มเติมได้ที่ซอร์สโค้ด )
- Tensor อินพุต 3 รายการ (kTfLiteString)
- Tensor ของรหัสที่มีชื่อข้อมูลเมตา "ids"
- Tensor ของมาสก์ที่มีชื่อข้อมูลเมตา "mask"
- Tensor รหัสกลุ่มที่มีชื่อข้อมูลเมตา "segment_ids"
- Tensor เอาต์พุต 1 รายการ (kTfLiteUInt8/kTfLiteFloat32)
- โดยมีN องค์ประกอบที่สอดคล้องกับN มิติของเวกเตอร์ฟีเจอร์ที่ส่งคืน สำหรับเลเยอร์เอาต์พุตนี้
- มิติข้อมูล 2 หรือ 4 รายการ เช่น [1 x N] หรือ [1 x 1 x 1 x N]
- หน่วยประมวลผลอินพุตสำหรับตัวแยกโทเค็น Wordpiece/Sentencepiece
โมเดลที่อิงตาม Universal Sentence Encoder (ดูรายละเอียดเพิ่มเติมได้ที่ซอร์สโค้ด )
- Tensor อินพุต 3 รายการ (kTfLiteString)
- Tensor ข้อความค้นหาที่มีชื่อข้อมูลเมตา "inp_text"
- เทนเซอร์บริบทการตอบกลับที่มีชื่อข้อมูลเมตา "res_context"
- เทนเซอร์ข้อความตอบกลับที่มีชื่อข้อมูลเมตา "res_text"
- Tensor เอาต์พุต 2 รายการ (kTfLiteUInt8/kTfLiteFloat32)
- เทนเซอร์การเข้ารหัสการค้นหาที่มีชื่อข้อมูลเมตา "query_encoding"
- เทนเซอร์การเข้ารหัสการตอบกลับที่มีชื่อข้อมูลเมตา "response_encoding"
- ทั้ง 2 อย่างมีคอมโพเนนต์ N ที่สอดคล้องกับมิติข้อมูล N ของ เวกเตอร์ฟีเจอร์ที่ส่งคืนสำหรับเลเยอร์เอาต์พุตนี้
- ทั้ง 2 แบบมีมิติข้อมูล 2 หรือ 4 รายการ นั่นคือ [1 x N] หรือ [1 x 1 x 1 x N]
โมเดลการฝังข้อความที่มีคุณสมบัติดังนี้
- Tensor ข้อความอินพุต (kTfLiteString)
- เทนเซอร์การฝังเอาต์พุตอย่างน้อย 1 รายการ (kTfLiteUInt8/kTfLiteFloat32)
- โดยมีN องค์ประกอบที่สอดคล้องกับN มิติของเวกเตอร์ฟีเจอร์ที่ส่งคืน สำหรับเลเยอร์เอาต์พุตนี้
- มิติข้อมูล 2 หรือ 4 รายการ เช่น [1 x N] หรือ [1 x 1 x 1 x N]