ผสานรวมกับเครื่องมือค้นหารูปภาพ

การค้นหารูปภาพช่วยให้ค้นหารูปภาพที่คล้ายกันในฐานข้อมูลรูปภาพได้ ทั้งนี้ ทำงานโดยการฝังคำค้นหาลงในเวกเตอร์ที่มีมิติสูงซึ่งแสดงถึง ความหมายของคำค้นหา ตามด้วยการค้นหาความคล้ายคลึงกันในคำค้นหา ดัชนีที่กำหนดไว้ล่วงหน้า ดัชนีที่กำหนดเองโดยใช้ ScaNN (เพื่อนบ้านที่ใกล้เคียงที่สุดที่รองรับการปรับขนาด)

ตรงข้ามกับ การจำแนกประเภทรูปภาพ เพิ่มจำนวนรายการที่จดจำได้ไม่จำเป็นต้องมีการฝึกซ้ำ โมเดลทั้งหมด รายการใหม่สามารถเพิ่มเข้ามาได้ง่ายๆ เพียงสร้างดัชนีขึ้นมาใหม่ ยัง ช่วยให้ทำงานกับฐานข้อมูลรูปภาพขนาดใหญ่ (มากกว่า 100,000 รายการ) ได้

ใช้ API ของไลบรารีงาน ImageSearcher เพื่อทำให้เครื่องมือค้นหารูปภาพที่กำหนดเองใช้งานได้ ในแอปบนอุปกรณ์เคลื่อนที่ของคุณ

คุณลักษณะที่สำคัญของ ImageSearcher API

  • จะนำรูปภาพเดียวเป็นอินพุต ดำเนินการดึงข้อมูลที่ฝัง และ ค้นหาเพื่อนบ้านที่ใกล้ที่สุดในดัชนี

  • การประมวลผลรูปภาพที่ป้อน รวมถึงการหมุน การปรับขนาด และพื้นที่สี Conversion

  • ภูมิภาคที่สนใจของรูปภาพอินพุต

ข้อกำหนดเบื้องต้น

ก่อนที่จะใช้ ImageSearcher API คุณต้องสร้างดัชนีตาม คลังข้อมูลภาพที่กำหนดเองที่จะค้นหา ซึ่งทำได้โดยใช้ Model Maker Searcher API ด้วยการติดตามและปรับเปลี่ยน บทแนะนำ

โดยคุณจะต้องมีสิ่งต่อไปนี้

  • โมเดล TFLite รูปภาพแบบฝัง เช่น mobilenet v3 ดูโมเดลเครื่องมือฝังข้อมูลที่ฝึกไว้แล้วล่วงหน้า (หรือที่เรียกว่าโมเดลเวกเตอร์ฟีเจอร์) จาก คอลเล็กชัน Google Image Modules ใน Kaggle Models
  • คลังรูปภาพของคุณ

หลังจากขั้นตอนนี้ คุณควรใช้โมเดลผู้ค้นหา TFLite แบบสแตนด์อโลน (เช่น mobilenet_v3_searcher.tflite) ซึ่งเป็นโมเดลเครื่องมือฝังรูปภาพดั้งเดิมที่มี ดัชนีที่แนบมากับ ข้อมูลเมตาของโมเดล TFLite

เรียกใช้การอนุมานใน Java

ขั้นตอนที่ 1: นำเข้าการอ้างอิง Gradle และการตั้งค่าอื่นๆ

คัดลอกไฟล์โมเดลของผู้ค้นหา .tflite ไปยังไดเรกทอรี Asset ของ Android โมดูลที่โมเดลจะทำงาน ระบุว่าไฟล์ไม่ควรเป็น บีบอัดแล้วเพิ่มไลบรารี TensorFlow Lite ลงใน build.gradle ของโมดูล ไฟล์:

android {
    // Other settings

    // Specify tflite index file should not be compressed for the app apk
    aaptOptions {
        noCompress "tflite"
    }

}

dependencies {
    // Other dependencies

    // Import the Task Vision Library dependency
    implementation 'org.tensorflow:tensorflow-lite-task-vision:0.4.4'
    // Import the GPU delegate plugin Library for GPU inference
    implementation 'org.tensorflow:tensorflow-lite-gpu-delegate-plugin:0.4.4'
}

ขั้นตอนที่ 2: การใช้โมเดล

// Initialization
ImageSearcherOptions options =
    ImageSearcherOptions.builder()
        .setBaseOptions(BaseOptions.builder().useGpu().build())
        .setSearcherOptions(
            SearcherOptions.builder().setL2Normalize(true).build())
        .build();
ImageSearcher imageSearcher =
    ImageSearcher.createFromFileAndOptions(context, modelFile, options);

// Run inference
List<NearestNeighbor> results = imageSearcher.search(image);

โปรดดู ซอร์สโค้ดและ javadoc เพื่อดูตัวเลือกเพิ่มเติมในการกำหนดค่า ImageSearcher

เรียกใช้การอนุมานใน C++

// Initialization
ImageSearcherOptions options;
options.mutable_base_options()->mutable_model_file()->set_file_name(model_path);
options.mutable_embedding_options()->set_l2_normalize(true);
std::unique_ptr<ImageSearcher> image_searcher = ImageSearcher::CreateFromOptions(options).value();

// Create input frame_buffer from your inputs, `image_data` and `image_dimension`.
// See more information here: tensorflow_lite_support/cc/task/vision/utils/frame_buffer_common_utils.h
std::unique_ptr<FrameBuffer> frame_buffer = CreateFromRgbRawBuffer(
      image_data, image_dimension);

// Run inference
const SearchResult result = image_searcher->Search(*frame_buffer).value();

โปรดดู ซอร์สโค้ด เพื่อดูตัวเลือกเพิ่มเติมในการกำหนดค่า ImageSearcher

เรียกใช้การอนุมานใน Python

ขั้นตอนที่ 1: ติดตั้งแพ็กเกจ Pypi Support ของ TensorFlow Lite

คุณสามารถติดตั้งแพ็กเกจ Pypi สนับสนุน TensorFlow Lite โดยใช้สิ่งต่อไปนี้ คำสั่ง:

pip install tflite-support

ขั้นตอนที่ 2: การใช้โมเดล

from tflite_support.task import vision

# Initialization
image_searcher = vision.ImageSearcher.create_from_file(model_path)

# Run inference
image = vision.TensorImage.create_from_file(image_file)
result = image_searcher.search(image)

โปรดดู ซอร์สโค้ด เพื่อดูตัวเลือกเพิ่มเติมในการกำหนดค่า ImageSearcher

ตัวอย่างผลการแข่ง

Results:
 Rank#0:
  metadata: burger
  distance: 0.13452
 Rank#1:
  metadata: car
  distance: 1.81935
 Rank#2:
  metadata: bird
  distance: 1.96617
 Rank#3:
  metadata: dog
  distance: 2.05610
 Rank#4:
  metadata: cat
  distance: 2.06347

ลองใช้ เครื่องมือสาธิต CLI สำหรับ ImageSearcher กับโมเดลและข้อมูลทดสอบของคุณเอง