Model Garden proporciona una colección de modelos de aprendizaje automático (AA) de vanguardia para capacidades de visión, texto y audio. Estos modelos están optimizados para usarse con el SDK de Google Tensor, lo que te permite incorporar potentes funciones basadas en IA directamente a tus dispositivos Pixel con un rendimiento integrado en el dispositivo fluido.
Estimación de profundidad
| Modelo | Licencia |
|---|---|
| depth_anything_v2 | Apache-2.0 |
| midas_v2_1 | BSD de 3 cláusulas |
Reconstrucción facial
| Modelo | Licencia |
|---|---|
| facemap_3dmm | BSD de 3 cláusulas |
Comprensión de imágenes y texto
| Modelo | Licencia |
|---|---|
| clip | MIT |
| mobileclip_image_encoder | MIT |
| mobileclip_text_encoder | MIT |
| tinyclip | MIT |
Clasificación de imágenes
| Modelo | Licencia |
|---|---|
| alexnet | BSD de 3 cláusulas |
| beit | BSD de 3 cláusulas |
| convnext_base | BSD de 3 cláusulas |
| convnext_tiny | BSD de 3 cláusulas |
| densenet121 | BSD de 3 cláusulas |
| efficientformer_l1 | Apache-2.0 |
| efficientformerv2_s0 | Apache-2.0 |
| efficientnet_b0 | BSD de 3 cláusulas |
| efficientnet_b1 | BSD de 3 cláusulas |
| efficientnet_b2 | BSD de 3 cláusulas |
| efficientnet_b3 | BSD de 3 cláusulas |
| efficientnet_b4 | BSD de 3 cláusulas |
| efficientnet_b5 | BSD de 3 cláusulas |
| efficientnet_b6 | BSD de 3 cláusulas |
| efficientnet_b7 | BSD de 3 cláusulas |
| efficientnet_v2_s | BSD de 3 cláusulas |
| efficientnetv2_m | APACHE-2.0 |
| efficientvit_cls_b2 | BSD de 3 cláusulas |
| efficientvit_cls_l2 | BSD de 3 cláusulas |
| efficientvit_seg_l2 | APACHE-2.0 |
| googlenet | BSD de 3 cláusulas |
| inception_v3 | BSD de 3 cláusulas |
| levit | APACHE-2.0 |
| maxvit_t | BSD de 3 cláusulas |
| mnasnet0 | BSD de 3 cláusulas |
| mobile_vit | BSD de 3 cláusulas |
| mobilenet_v2 | APACHE-2.0 |
| mobilenet_v3_large | BSD de 3 cláusulas |
| mobilenet_v3_small | BSD de 3 cláusulas |
| mobilenetv4_conv_l | BSD de 3 cláusulas |
| mobilenetv4_conv_m | BSD de 3 cláusulas |
| mobilenetv4_conv_s | BSD de 3 cláusulas |
| mobilenetv4_hybrid_l | BSD de 3 cláusulas |
| mobilenetv4_hybrid_medium | APACHE-2.0 |
| nfnet | BSD de 3 cláusulas |
| pvt_v2_b1 | BSD de 3 cláusulas |
| pvt_v2_b3 | BSD de 3 cláusulas |
| regnety | APACHE-2.0 |
| resnest14d | BSD de 3 cláusulas |
| resnet101 | BSD de 3 cláusulas |
| resnet152 | BSD de 3 cláusulas |
| resnet18 | BSD de 3 cláusulas |
| resnet50 | BSD de 3 cláusulas |
| resnext101 | AI-HUB-MODELS |
| resnext50 | BSD de 3 cláusulas |
| shufflenet_v2 | BSD de 3 cláusulas |
| squeezenet1 | BSD de 3 cláusulas |
| swin_small | BSD de 3 cláusulas |
| swin_tiny | BSD de 3 cláusulas |
| tf_efficientnetv2_m | APACHE-2.0 |
| vgg16 | BSD de 3 cláusulas |
| vit_base_patch16 | APACHE-2.0 |
| vit_small_patch16 | BSD de 3 cláusulas |
| wide_resnet101 | BSD de 3 cláusulas |
| wide_resnet50 | BSD de 3 cláusulas |
Segmentación de imágenes
| Modelo | Licencia |
|---|---|
| hrnet_w48_ocr | MIT |
| mediapipe_selfie | APACHE-2.0 |
| unet_segmentation | GPL-3.0 |
Superresolución de imagen
| Modelo | Licencia |
|---|---|
| esrgan | APACHE-2.0 |
Detección de objetos
| Modelo | Licencia |
|---|---|
| 3d_deep_box | MIT |
| conditional_detr_resnet50 | Apache-2.0 |
| detr_resnet50 | Apache-2.0 |
| detr_resnet50_dc5 | Apache-2.0 |
| detr_resnet101 | Apache-2.0 |
| detr_resnet101_dc5 | Apache-2.0 |
| faceattribnet | AI-HUB-MODELS |
| lightweight_face_detection | AI-HUB-MODELS |
| mediapipe_hand_detection | APACHE-2.0 |
| person_foot_detection | AI-HUB-MODELS |
| ppe_detection | AI-HUB-MODELS |
| yolo_v4 | Apache-2.0 |
| yolo_v6 | GPL-3.0 |
| yolo_v7 | GPL-3.0 |
| yolos_tiny | APACHE-2.0 |
| yolox_tiny | APACHE-2.0 |
Estimación de poses
| Modelo | Licencia |
|---|---|
| hrnet_pose | MIT |
| lite_hrnet_pose | APACHE-2.0 |
| mediapipe_pose | APACHE-2.0 |
| movenet | MIT |
Búsqueda de respuestas
| Modelo | Licencia |
|---|---|
| tinyroberta | CC-BY-4.0 |
Segmentación semántica
| Modelo | Licencia |
|---|---|
| bgnet | Apache-2.0 |
| bisenet | No hay archivo de licencia |
| ddrnet23_slim | MIT |
| deeplabv3_mobilenet_v3_large | BSD de 3 cláusulas |
| deeplabv3_plus_mobilenet | MIT |
| deeplabv3_resnet101 | BSD de 3 cláusulas |
| deeplabv3_resnet50 | BSD de 3 cláusulas |
| fcn_resnet50 | BSD de 3 cláusulas |
| ffnet_122ns_lowres | BSD de 3 cláusulas |
| ffnet_40s | BSD de 3 cláusulas |
| ffnet_54s | BSD de 3 cláusulas |
| ffnet_78s_lowres | BSD de 3 cláusulas |
| isnet | Apache 2.0 |
| lraspp_mobilenet_v3_large | BSD de 3 cláusulas |
| sam_vit_b | APACHE-2.0 |
| sam_vit_l | APACHE-2.0 |
| segformer | NVIDIA-SCSL |
| segment_anything_model | Apache-2.0 |
| u2net_full | APACHE-2.0 |
| u2net_lite | APACHE-2.0 |
Reconocimiento de voz
| Modelo | Licencia |
|---|---|
| deepspeech | BSD-2-Clause |
| torchaudio_emformer_rnnt_base | BSD-2-Clause |
| wav2vec2_base_960h | APACHE-2.0 |
Superresolución
| Modelo | Licencia |
|---|---|
| quicksrnet_large | BSD de 3 cláusulas |
| quicksrnet_small | BSD de 3 cláusulas |
| real_esrgan_general_x4v3 | BSD de 3 cláusulas |
| real_esrgan_x4plus | BSD de 3 cláusulas |
| xlsr | BSD de 3 cláusulas |
Clasificación de textos
| Modelo | Licencia |
|---|---|
| distilbert | Apache-2.0 |
| mobilebert | Apache-2.0 |