Model Garden cung cấp một bộ sưu tập các mô hình học máy (ML) hiện đại cho các chức năng về thị giác, văn bản và âm thanh. Các mô hình này được tối ưu hoá để sử dụng với Google Tensor SDK, cho phép bạn đưa các tính năng AI mạnh mẽ trực tiếp vào thiết bị Pixel của mình với hiệu suất liền mạch trên thiết bị.
Ước tính độ sâu
| Mô hình | Giấy phép |
|---|---|
| depth_anything_v2 | Apache-2.0 |
| midas_v2_1 | BSD-3-Clause |
Tái tạo khuôn mặt
| Mô hình | Giấy phép |
|---|---|
| facemap_3dmm | BSD-3-Clause |
Hiểu hình ảnh và văn bản
| Mô hình | Giấy phép |
|---|---|
| clip | MIT |
| mobileclip_image_encoder | MIT |
| mobileclip_text_encoder | MIT |
| tinyclip | MIT |
Phân loại hình ảnh
| Mô hình | Giấy phép |
|---|---|
| alexnet | BSD-3-Clause |
| beit | BSD-3-Clause |
| convnext_base | BSD-3-Clause |
| convnext_tiny | BSD-3-Clause |
| densenet121 | BSD-3-Clause |
| efficientformer_l1 | Apache-2.0 |
| efficientformerv2_s0 | Apache-2.0 |
| efficientnet_b0 | BSD-3-Clause |
| efficientnet_b1 | BSD-3-Clause |
| efficientnet_b2 | BSD-3-Clause |
| efficientnet_b3 | BSD-3-Clause |
| efficientnet_b4 | BSD-3-Clause |
| efficientnet_b5 | BSD-3-Clause |
| efficientnet_b6 | BSD-3-Clause |
| efficientnet_b7 | BSD-3-Clause |
| efficientnet_v2_s | BSD-3-Clause |
| efficientnetv2_m | APACHE-2.0 |
| efficientvit_cls_b2 | BSD-3-Clause |
| efficientvit_cls_l2 | BSD-3-Clause |
| efficientvit_seg_l2 | APACHE-2.0 |
| googlenet | BSD-3-Clause |
| inception_v3 | BSD-3-Clause |
| levit | APACHE-2.0 |
| maxvit_t | BSD-3-Clause |
| mnasnet0 | BSD-3-Clause |
| mobile_vit | BSD-3-Clause |
| mobilenet_v2 | APACHE-2.0 |
| mobilenet_v3_large | BSD-3-Clause |
| mobilenet_v3_small | BSD-3-Clause |
| mobilenetv4_conv_l | BSD-3-Clause |
| mobilenetv4_conv_m | BSD-3-Clause |
| mobilenetv4_conv_s | BSD-3-Clause |
| mobilenetv4_hybrid_l | BSD-3-Clause |
| mobilenetv4_hybrid_medium | APACHE-2.0 |
| nfnet | BSD-3-Clause |
| pvt_v2_b1 | BSD-3-Clause |
| pvt_v2_b3 | BSD-3-Clause |
| regnety | APACHE-2.0 |
| resnest14d | BSD-3-Clause |
| resnet101 | BSD-3-Clause |
| resnet152 | BSD-3-Clause |
| resnet18 | BSD-3-Clause |
| resnet50 | BSD-3-Clause |
| resnext101 | AI-HUB-MODELS |
| resnext50 | BSD-3-Clause |
| shufflenet_v2 | BSD-3-Clause |
| squeezenet1 | BSD-3-Clause |
| swin_small | BSD-3-Clause |
| swin_tiny | BSD-3-Clause |
| tf_efficientnetv2_m | APACHE-2.0 |
| vgg16 | BSD-3-Clause |
| vit_base_patch16 | APACHE-2.0 |
| vit_small_patch16 | BSD-3-Clause |
| wide_resnet101 | BSD-3-Clause |
| wide_resnet50 | BSD-3-Clause |
Phân đoạn hình ảnh
| Mô hình | Giấy phép |
|---|---|
| hrnet_w48_ocr | MIT |
| mediapipe_selfie | APACHE-2.0 |
| unet_segmentation | GPL-3.0 |
Tính năng Siêu phân giải hình ảnh
| Mô hình | Giấy phép |
|---|---|
| esrgan | APACHE-2.0 |
Phát hiện vật thể
| Mô hình | Giấy phép |
|---|---|
| 3d_deep_box | MIT |
| conditional_detr_resnet50 | Apache-2.0 |
| detr_resnet50 | Apache-2.0 |
| detr_resnet50_dc5 | Apache-2.0 |
| detr_resnet101 | Apache-2.0 |
| detr_resnet101_dc5 | Apache-2.0 |
| faceattribnet | AI-HUB-MODELS |
| lightweight_face_detection | AI-HUB-MODELS |
| mediapipe_hand_detection | APACHE-2.0 |
| person_foot_detection | AI-HUB-MODELS |
| ppe_detection | AI-HUB-MODELS |
| yolo_v4 | Apache-2.0 |
| yolo_v6 | GPL-3.0 |
| yolo_v7 | GPL-3.0 |
| yolos_tiny | APACHE-2.0 |
| yolox_tiny | APACHE-2.0 |
Ước tính tư thế
| Mô hình | Giấy phép |
|---|---|
| hrnet_pose | MIT |
| lite_hrnet_pose | APACHE-2.0 |
| mediapipe_pose | APACHE-2.0 |
| movenet | MIT |
Trả lời câu hỏi
| Mô hình | Giấy phép |
|---|---|
| tinyroberta | CC-BY-4.0 |
Phân đoạn ngữ nghĩa
| Mô hình | Giấy phép |
|---|---|
| bgnet | Apache-2.0 |
| bisenet | Không có tệp giấy phép |
| ddrnet23_slim | MIT |
| deeplabv3_mobilenet_v3_large | BSD-3-Clause |
| deeplabv3_plus_mobilenet | MIT |
| deeplabv3_resnet101 | BSD-3-Clause |
| deeplabv3_resnet50 | BSD-3-Clause |
| fcn_resnet50 | BSD-3-Clause |
| ffnet_122ns_lowres | BSD-3-Clause |
| ffnet_40s | BSD-3-Clause |
| ffnet_54s | BSD-3-Clause |
| ffnet_78s_lowres | BSD-3-Clause |
| isnet | Apache 2.0 |
| lraspp_mobilenet_v3_large | BSD-3-Clause |
| sam_vit_b | APACHE-2.0 |
| sam_vit_l | APACHE-2.0 |
| segformer | NVIDIA-SCSL |
| segment_anything_model | Apache-2.0 |
| u2net_full | APACHE-2.0 |
| u2net_lite | APACHE-2.0 |
Nhận dạng giọng nói
| Mô hình | Giấy phép |
|---|---|
| deepspeech | BSD-2-Clause |
| torchaudio_emformer_rnnt_base | BSD-2-Clause |
| wav2vec2_base_960h | APACHE-2.0 |
Siêu phân giải
| Mô hình | Giấy phép |
|---|---|
| quicksrnet_large | BSD-3-Clause |
| quicksrnet_small | BSD-3-Clause |
| real_esrgan_general_x4v3 | BSD-3-Clause |
| real_esrgan_x4plus | BSD-3-Clause |
| xlsr | BSD-3-Clause |
Phân loại văn bản
| Mô hình | Giấy phép |
|---|---|
| distilbert | Apache-2.0 |
| mobilebert | Apache-2.0 |