Định lượng TensorBuffer bằng zeroPoint và scale cho trước.
Lưu ý: QuantizeOp không truyền dữ liệu đầu ra sang UINT8 mà chỉ thực hiện phép toán lượng tử hoá ở đầu vào. Loại dữ liệu của tensor đầu ra luôn là FLOAT32 ngoại trừ việc Op thực sự là một Ops nhận dạng (trong trường hợp này, tensor đầu ra cũng giống như đầu vào). Để kết nối với mô hình lượng tử hoá, bạn có thể cần có CastOp.
Nếu cả zeroPoint và scale đều bằng 0, thì QuantizeOp sẽ bị bỏ qua, tương đương với việc đặt zeroPoint thành 0 và scale thành 1. Điều này có thể hữu ích khi truyền các thông số lượng tử hoá được trích xuất trực tiếp từ vùng đệm phẳng của mô hình TFLite. Nếu tensor không được lượng tử hoá, thì cả zeroPoint và scale sẽ được đọc là 0.
[[["Dễ hiểu","easyToUnderstand","thumb-up"],["Giúp tôi giải quyết được vấn đề","solvedMyProblem","thumb-up"],["Khác","otherUp","thumb-up"]],[["Thiếu thông tin tôi cần","missingTheInformationINeed","thumb-down"],["Quá phức tạp/quá nhiều bước","tooComplicatedTooManySteps","thumb-down"],["Đã lỗi thời","outOfDate","thumb-down"],["Vấn đề về bản dịch","translationIssue","thumb-down"],["Vấn đề về mẫu/mã","samplesCodeIssue","thumb-down"],["Khác","otherDown","thumb-down"]],["Cập nhật lần gần đây nhất: 2025-07-24 UTC."],[],[]]