เวอร์ชันโอเปอเรเตอร์ LiteRT

เอกสารนี้อธิบายสคีมาการกำหนดเวอร์ชัน op ของ LiteRT การกำหนดเวอร์ชัน Op ช่วยให้นักพัฒนาซอฟต์แวร์เพิ่มฟังก์ชันและพารามิเตอร์ใหม่ๆ ใน Ops ที่มีอยู่ได้ นอกจากนี้ เรายังรับประกันสิ่งต่อไปนี้ด้วย

  • ความเข้ากันได้แบบย้อนหลัง: การใช้งาน LiteRT ใหม่ควรรองรับ ไฟล์โมเดลเก่า
  • ความเข้ากันได้ในอนาคต: การใช้งาน LiteRT แบบเก่าควรจัดการกับ ไฟล์โมเดลใหม่ที่สร้างจากตัวแปลงเวอร์ชันใหม่ ตราบใดที่ไม่มีไฟล์ใหม่
  • การตรวจจับความเข้ากันได้แบบส่งต่อ: หากการใช้งาน LiteRT แบบเก่า อ่านโมเดลใหม่ที่มีการดำเนินการเวอร์ชันใหม่ซึ่งไม่ใช่ ไฟล์จะรายงานข้อผิดพลาด

ตัวอย่าง: การเพิ่มการขยายขนาดใน depthwise Convolution

ส่วนที่เหลือของเอกสารนี้จะอธิบายการกำหนดเวอร์ชันตัวเลือกใน TFLite โดยแสดงวิธีการ เพื่อเพิ่มพารามิเตอร์การขยายไปยังการดำเนินการคอนโวลูชันความลึก

คุณไม่จำเป็นต้องมีความรู้เรื่องการขยายตัวเพื่อทำความเข้าใจเอกสารนี้ โปรดทราบว่า

  • ระบบจะเพิ่มพารามิเตอร์จำนวนเต็มใหม่ 2 รายการ ได้แก่ dilation_width_factor และ dilation_height_factor
  • เคอร์เนลคอนโวลูชันแบบความลึกแบบเก่าที่ไม่รองรับการขยายขนาดจะเทียบเท่ากัน เป็นการตั้งค่าตัวคูณการขยายเป็น 1

เปลี่ยนสคีมา FlatBuffer

หากต้องการเพิ่มพารามิเตอร์ใหม่ลงในการดำเนินการ ให้เปลี่ยนตารางตัวเลือกใน lite/schema/schema.fbs

ตัวอย่างเช่น ตารางตัวเลือกของ depthwise Convolution มีลักษณะดังนี้

table DepthwiseConv2DOptions {
  padding:Padding;
  stride_w:int;
  stride_h:int;
  depth_multiplier:int;
  fused_activation_function:ActivationFunctionType;
}

เมื่อเพิ่มพารามิเตอร์ใหม่

  • เพิ่มความคิดเห็นที่ระบุพารามิเตอร์ที่เวอร์ชันรองรับ
  • เมื่อการติดตั้งใช้งานใหม่ได้รับค่าเริ่มต้นสําหรับที่เพิ่มเข้ามาใหม่ พารามิเตอร์ คุณควรทำงานเหมือนกับการติดตั้งเดิมทุกประการ

ตารางจะมีลักษณะดังนี้หลังจากเพิ่มพารามิเตอร์ใหม่

table DepthwiseConv2DOptions {
  // Parameters for DepthwiseConv version 1 or above.
  padding:Padding;
  stride_w:int;
  stride_h:int;
  depth_multiplier:int;
  fused_activation_function:ActivationFunctionType;
  // Parameters for DepthwiseConv version 2 or above.
  dilation_w_factor:int = 1;
  dilation_h_factor:int = 1;
}

ระบบจะสร้างไฟล์ lite/schema/schema_generated.h ใหม่สำหรับ สคีมา

เปลี่ยนโครงสร้าง C และการใช้งานเคอร์เนล

ใน LiteRT การใช้งานเคอร์เนลจะแยกออกจาก FlatBuffer ของเรา เคอร์เนลอ่านพารามิเตอร์จากโครงสร้าง C ที่กำหนดไว้ใน lite/c/builtin_op_data.h

พารามิเตอร์ depthwise Convolution ดั้งเดิมมีดังนี้

typedef struct {
  TfLitePadding padding;
  int stride_width;
  int stride_height;
  int depth_multiplier;
  TfLiteFusedActivation activation;
} TfLiteDepthwiseConvParams;

เช่นเดียวกับสคีมา FlatBuffer โปรดเพิ่มความคิดเห็นเพื่อบ่งชี้ว่าพารามิเตอร์ใด เริ่มจากเวอร์ชันใด โปรดดูผลลัพธ์ด้านล่าง

typedef struct {
  // Parameters for DepthwiseConv version 1 or above.
  TfLitePadding padding;
  int stride_width;
  int stride_height;
  int depth_multiplier;
  TfLiteFusedActivation activation;
  // Parameters for DepthwiseConv version 2 or above.
  int dilation_width_factor;
  int dilation_height_factor;
} TfLiteDepthwiseConvParams;

โปรดเปลี่ยนการใช้งานเคอร์เนลเพื่ออ่านพารามิเตอร์ที่เพิ่มเข้ามาใหม่ด้วย จากโครงสร้าง C ระบบจะไม่แสดงรายละเอียดที่นี่

เปลี่ยนโค้ดการอ่าน FlatBuffer

ตรรกะในการอ่าน FlatBuffer และโครงสร้าง C อยู่ใน lite/core/api/flatbuffer_conversions.cc

อัปเดตไฟล์เพื่อจัดการพารามิเตอร์ใหม่ตามที่แสดงด้านล่าง

TfLiteStatus ParseDepthwiseConv2D(const Operator* op,
                                  ErrorReporter* error_reporter,
                                  BuiltinDataAllocator* allocator,
                                  void** builtin_data) {
  CheckParsePointerParams(op, error_reporter, allocator, builtin_data);

  SafeBuiltinDataAllocator safe_allocator(allocator);

  std::unique_ptr<TfLiteDepthwiseConvParams,
                  SafeBuiltinDataAllocator::BuiltinDataDeleter>
      params = safe_allocator.Allocate<TfLiteDepthwiseConvParams>();
  TF_LITE_ENSURE(error_reporter, params != nullptr);

  const DepthwiseConv2DOptions* schema_params =
      op->builtin_options_as_DepthwiseConv2DOptions();

  if (schema_params != nullptr) {
    params->padding = ConvertPadding(schema_params->padding());
    params->stride_width = schema_params->stride_w();
    params->stride_height = schema_params->stride_h();
    params->depth_multiplier = schema_params->depth_multiplier();
    params->activation =
        ConvertActivation(schema_params->fused_activation_function());

    params->dilation_width_factor = schema_params->dilation_w_factor();
    params->dilation_height_factor = schema_params->dilation_h_factor();
  }

  *builtin_data = params.release();
  return kTfLiteOk;
}

โดยไม่จำเป็นต้องตรวจสอบเวอร์ชันการดำเนินการที่นี่ เมื่อมีการปรับใช้ใหม่ อ่านไฟล์โมเดลเก่าที่ไม่มีตัวคูณการขยายออก ระบบจะใช้ 1 เป็นค่า และเคอร์เนลใหม่จะทำงานอย่างต่อเนื่องกับเคอร์เนลเก่า

เปลี่ยนการลงทะเบียนเคอร์เนล

MutableOpReachr (ตามคำจำกัดความใน lite/mutable_op_resolver.h) มี เพื่อลงทะเบียนเคอร์เนล Opinion เวอร์ชันต่ำสุดและสูงสุดคือ 1 คูณ ค่าเริ่มต้น:

void AddBuiltin(tflite::BuiltinOperator op, TfLiteRegistration* registration,
                int min_version = 1, int max_version = 1);
void AddCustom(const char* name, TfLiteRegistration* registration,
               int min_version = 1, int max_version = 1);

การดำเนินการในตัวจะลงทะเบียนใน lite/kernels/register.cc ในตัวอย่างนี้ เราได้ใช้เคอร์เนล Opinion ใหม่ซึ่งสามารถจัดการ DepthwiseConv2D เวอร์ชัน 1 และ 2 ดังนั้นเราต้องเปลี่ยนบรรทัดนี้

AddBuiltin(BuiltinOperator_DEPTHWISE_CONV_2D, Register_DEPTHWISE_CONV_2D());

ถึง:

AddBuiltin(BuiltinOperator_DEPTHWISE_CONV_2D, Register_DEPTHWISE_CONV_2D(),
             /* min_version = */ 1,
             /* max_version = */ 2);

เปลี่ยนเวอร์ชัน TFLite op

ขั้นตอนถัดไปคือทำให้ TFLite ป้อนข้อมูลเวอร์ชันขั้นต่ำที่จำเป็นสำหรับ ใช้การดำเนินการ ในตัวอย่างนี้หมายถึง

  • ป้อนข้อมูล version=1 เมื่อปัจจัยการขยายทั้งหมดเป็น 1
  • ป้อนข้อมูล version=2 หรือไม่เช่นนั้น

แก้ไขฟังก์ชัน GetBuiltinOperatorVersion สำหรับโอเปอเรเตอร์ใน lite/tools/versioning/op_version.cc ด้วยการเพิ่มเวอร์ชันใหม่ลงในเคสของ DepthwiseConv2D:

case BuiltinOperator_DEPTHWISE_CONV_2D:
  auto depthwise_conv_params =
      reinterpret_cast<TfLiteDepthwiseConvParams*>(op_sig.builtin_data);
  TFLITE_DCHECK(depthwise_conv_params != nullptr);
  if (depthwise_conv_params->dilation_width_factor != 1 ||
       depthwise_conv_params->dilation_height_factor != 1) {
    return 2;
  }
  return 1;

อัปเดตแมปเวอร์ชันโอเปอเรเตอร์

ขั้นตอนสุดท้ายคือเพิ่มข้อมูลเวอร์ชันใหม่ลงในการแมปเวอร์ชันของโอเปอเรเตอร์ ช่วงเวลานี้ เพราะเราต้องสร้าง จำนวนขั้นต่ำของโมเดลที่จำเป็น เวอร์ชันรันไทม์ตามการแมปเวอร์ชันนี้

ในการดำเนินการนี้ คุณต้องเพิ่มรายการแผนที่ใหม่ใน lite/tools/versioning/runtime_version.cc

ในตัวอย่างนี้ คุณต้องเพิ่มรายการต่อไปนี้ใน op_version_map

{ {BuiltinOperator_DEPTHWISE_CONV_2D, 2}, %CURRENT_RUNTIME_VERSION%}

โดยที่ %CURRENT_RUNTIME_VERSION% สอดคล้องกับรันไทม์เวอร์ชันปัจจุบัน กำหนดไว้ใน tensorflow/core/public/version.h

การใช้การมอบสิทธิ์

LiteRT มี Delegation API ซึ่งช่วยให้สามารถมอบอำนาจการดำเนินการแก่ แบ็กเอนด์ของฮาร์ดแวร์ ในฟังก์ชัน Prepare ของผู้มอบสิทธิ์ ให้ตรวจสอบว่าเวอร์ชันคือ ทุกโหนดในรหัสการมอบสิทธิ์

const int kMaxVersion = 1;
TfLiteNode* node;
TfLiteRegistration* registration = nullptr;
TF_LITE_ENSURE_STATUS(context->GetNodeAndRegistration(context, node_index, &node, &registration));

if (registration->version > kMaxVersion) {
  // Reject the node if the version isn't supported.
}

ซึ่งจำเป็นแม้ว่าการมอบสิทธิ์จะรองรับเฉพาะการดำเนินการเวอร์ชัน 1 ดังนั้น การมอบสิทธิ์สามารถตรวจพบความไม่เข้ากันเมื่อได้รับการดำเนินการเวอร์ชันที่สูงกว่า