iOS için hareket tanıma kılavuzu

MediaPipe Hareket Tanıyıcısı görevi, el hareketlerini gerçek zamanlı olarak tanımanızı sağlar ve algılanan el hareketi sonuçlarını ve algılanan ellerin önemli el işaretlerini sağlar. Bu talimatlarda Hareket Tanıma Aracı'nın iOS uygulamalarıyla nasıl kullanılacağı gösterilmektedir.

Web demosunu görüntüleyerek bu görevi çalışırken görebilirsiniz. Bu görevin özellikleri, modelleri ve yapılandırma seçenekleri hakkında daha fazla bilgi için Genel Bakış bölümüne bakın.

Kod örneği

MediaPipe Tasks örnek kodu, iOS için Hareket Tanıyıcı uygulamasının temel bir uygulamasıdır. Örnekte, el hareketlerini sürekli olarak algılamak için fiziksel bir iOS cihazın kamerası ve hareketleri statik olarak algılamak için cihaz galerisindeki resim ve videolar da kullanılabilmektedir.

Uygulamayı kendi iOS uygulamanız için başlangıç noktası olarak kullanabilir veya mevcut bir uygulamayı değiştirirken referans olarak kullanabilirsiniz. Hareket Tanıma Aracı örnek kodu GitHub'da barındırılmaktadır.

Kodu indirme

Aşağıdaki talimatlar, git komut satırı aracını kullanarak örnek kodun yerel bir kopyasını nasıl oluşturacağınızı göstermektedir.

Örnek kodu indirmek için:

  1. Aşağıdaki komutu kullanarak git deposunu klonlayın:

    git clone https://github.com/google-ai-edge/mediapipe-samples
    
  2. İsteğe bağlı olarak, git örneğinizi az ödeme yöntemini kullanacak şekilde yapılandırın. Böylece, yalnızca Hareket Tanıyıcı örnek uygulamasına ait dosyalara sahip olursunuz:

    cd mediapipe
    git sparse-checkout init --cone
    git sparse-checkout set examples/gesture_recognizer/ios/
    

Örnek kodun yerel sürümünü oluşturduktan sonra MediaPipe görev kitaplığını yükleyebilir, Xcode kullanarak projeyi açabilir ve uygulamayı çalıştırabilirsiniz. Talimatlar için iOS için Kurulum Kılavuzu'na bakın.

Temel bileşenler

Aşağıdaki dosyalar, motion Recognizer örnek uygulaması için önemli kodu içerir:

Kurulum

Bu bölümde, Hareket Tanıma Aracı'nı kullanmak için geliştirme ortamınızı kurma ve projelerinizi kodlamanın temel adımları açıklanmaktadır. Platform sürümü gereksinimleri de dahil olmak üzere, MediaPipe görevlerini kullanmak amacıyla geliştirme ortamınızı ayarlama hakkında genel bilgiler için iOS için kurulum kılavuzuna bakın.

Bağımlılıklar

Hareket Tanıma Aracı, CocoaPods kullanılarak yüklenmesi gereken MediaPipeTasksVision kitaplığını kullanır. Kitaplık hem Swift hem de Objective-C uygulamalarıyla uyumludur ve dile özgü ek kurulum gerektirmez.

CocoaPods'u macOS'e yükleme talimatları için CocoaPods yükleme kılavuzuna bakın. Uygulamanız için gerekli kapsüllerle Podfile oluşturma talimatları için CocoaPods'u kullanma bölümüne bakın.

Aşağıdaki kodu kullanarak MediaPipeTasksVision kapsülünü Podfile içine ekleyin:

target 'MyGestureRecognizerApp' do
  use_frameworks!
  pod 'MediaPipeTasksVision'
end

Uygulamanız birim test hedefleri içeriyorsa Podfile cihazınızın kurulumuyla ilgili ek bilgiler için iOS için Kurulum Kılavuzu'na bakın.

Model

MediaPipe Hareket Tanıyıcı görevi, bu görevle uyumlu, eğitilmiş bir model gerektirir. Hareket Tanıyıcı için eğitilmiş modeller hakkında daha fazla bilgi edinmek için göreve genel bakış Modeller bölümüne bakın.

Bir model seçip indirin ve Xcode kullanarak proje dizininize ekleyin. Xcode projenize dosya ekleme talimatları için Xcode projenizde dosya ve klasörleri yönetme bölümüne bakın.

Uygulama paketinizdeki modelin yolunu belirtmek için BaseOptions.modelAssetPath özelliğini kullanın. Kod örneği için sonraki bölüme bakın.

Görevi oluşturma

Hareket Tanımlayıcı görevini, başlatıcılardan birini çağırarak oluşturabilirsiniz. GestureRecognizer(options:) başlatıcısı, yapılandırma seçenekleri için değerleri kabul eder.

Özelleştirilmiş yapılandırma seçenekleriyle başlatılan bir Hareket Tanıyıcı'ya ihtiyacınız yoksa varsayılan seçeneklerle bir Hareket Tanıyıcı oluşturmak için GestureRecognizer(modelPath:) başlatıcısını kullanabilirsiniz. Yapılandırma seçenekleri hakkında daha fazla bilgi için Yapılandırmaya Genel Bakış bölümüne bakın.

Hareket Tanıyıcı görevi 3 giriş veri türünü destekler: hareketsiz resimler, video dosyaları ve canlı video akışları. Varsayılan olarak GestureRecognizer(modelPath:), hareketsiz görüntüler için bir görev başlatır. Görevinizin video dosyalarını veya canlı video akışlarını işlemek üzere başlatılmasını istiyorsanız video veya canlı yayın çalışma modunu belirtmek için GestureRecognizer(options:) öğesini kullanın. Canlı yayın modu, Hareket Tanıma Aracı'nın hareket tanıma sonuçlarını yetki verilmiş kişiye eşzamansız olarak sunmasını sağlayan ek gestureRecognizerLiveStreamDelegate yapılandırma seçeneğini de gerektirir.

Görevi nasıl oluşturacağınızı ve çıkarımda bulunacağınızı görmek için koşu modunuza karşılık gelen sekmeyi seçin.

Swift

Resim

import MediaPipeTasksVision

let modelPath = Bundle.main.path(forResource: "gesture_recognizer",
                                      ofType: "task")

let options = GestureRecognizerOptions()
options.baseOptions.modelAssetPath = modelPath
options.runningMode = .image
options.minHandDetectionConfidence = minHandDetectionConfidence
options.minHandPresenceConfidence = minHandPresenceConfidence
options.minTrackingConfidence = minHandTrackingConfidence
options.numHands = numHands

let gestureRecognizer = try GestureRecognizer(options: options)
    

Video

import MediaPipeTasksVision

let modelPath = Bundle.main.path(forResource: "gesture_recognizer",
                                      ofType: "task")

let options = GestureRecognizerOptions()
options.baseOptions.modelAssetPath = modelPath
options.runningMode = .video
options.minHandDetectionConfidence = minHandDetectionConfidence
options.minHandPresenceConfidence = minHandPresenceConfidence
options.minTrackingConfidence = minHandTrackingConfidence
options.numHands = numHands

let gestureRecognizer = try GestureRecognizer(options: options)
    

Canlı yayın

import MediaPipeTasksVision

// Class that conforms to the `GestureRecognizerLiveStreamDelegate` protocol and
// implements the method that the gesture recognizer calls once it finishes
// performing recognizing hand gestures in each input frame.
class GestureRecognizerResultProcessor: NSObject, GestureRecognizerLiveStreamDelegate {

  func gestureRecognizer(
    _ gestureRecognizer: GestureRecognizer,
    didFinishRecognition result: GestureRecognizerResult?,
    timestampInMilliseconds: Int,
    error: Error?) {

    // Process the gesture recognizer result or errors here.

  }
}

let modelPath = Bundle.main.path(
  forResource: "gesture_recognizer",
  ofType: "task")

let options = GestureRecognizerOptions()
options.baseOptions.modelAssetPath = modelPath
options.runningMode = .liveStream
options.minHandDetectionConfidence = minHandDetectionConfidence
options.minHandPresenceConfidence = minHandPresenceConfidence
options.minTrackingConfidence = minHandTrackingConfidence
options.numHands = numHands

// Assign an object of the class to the `gestureRecognizerLiveStreamDelegate`
// property.
let processor = GestureRecognizerResultProcessor()
options.gestureRecognizerLiveStreamDelegate = processor

let gestureRecognizer = try GestureRecognizer(options: options)
    

Objective-C

Resim

@import MediaPipeTasksVision;

NSString *modelPath =
  [[NSBundle mainBundle] pathForResource:@"gesture_recognizer"
                                  ofType:@"task"];

MPPGestureRecognizerOptions *options =
  [[MPPGestureRecognizerOptions alloc] init];
options.baseOptions.modelAssetPath = modelPath;
options.runningMode = MPPRunningModeImage;
options.minHandDetectionConfidence = minHandDetectionConfidence
options.minHandPresenceConfidence = minHandPresenceConfidence
options.minTrackingConfidence = minHandTrackingConfidence
options.numHands = numHands

MPPGestureRecognizer *gestureRecognizer =
      [[MPPGestureRecognizer alloc] initWithOptions:options error:nil];
    

Video

@import MediaPipeTasksVision;

NSString *modelPath =
  [[NSBundle mainBundle] pathForResource:@"gesture_recognizer"
                                  ofType:@"task"];

MPPGestureRecognizerOptions *options =
  [[MPPGestureRecognizerOptions alloc] init];
options.baseOptions.modelAssetPath = modelPath;
options.runningMode = MPPRunningModeVideo;
options.minHandDetectionConfidence = minHandDetectionConfidence
options.minHandPresenceConfidence = minHandPresenceConfidence
options.minTrackingConfidence = minHandTrackingConfidence
options.numHands = numHands

MPPGestureRecognizer *gestureRecognizer =
      [[MPPGestureRecognizer alloc] initWithOptions:options error:nil];
    

Canlı yayın

@import MediaPipeTasksVision;

// Class that conforms to the `MPPGestureRecognizerLiveStreamDelegate` protocol
// and implements the method that the gesture recognizer calls once it finishes
// performing gesture recognition on each input frame.

@interface APPGestureRecognizerResultProcessor : NSObject 

@end

@implementation APPGestureRecognizerResultProcessor

-   (void)gestureRecognizer:(MPPGestureRecognizer *)gestureRecognizer
    didFinishRecognitionWithResult:(MPPGestureRecognizerResult *)gestureRecognizerResult
           timestampInMilliseconds:(NSInteger)timestampInMilliseconds
                             error:(NSError *)error {

    // Process the gesture recognizer result or errors here.

}

@end

NSString *modelPath =
  [[NSBundle mainBundle] pathForResource:@"gesture_recognizer"
                                  ofType:@"task"];

MPPGestureRecognizerOptions *options =
  [[MPPGestureRecognizerOptions alloc] init];
options.baseOptions.modelAssetPath = modelPath;
options.runningMode = MPPRunningModeLiveStream;
options.minHandDetectionConfidence = minHandDetectionConfidence
options.minHandPresenceConfidence = minHandPresenceConfidence
options.minTrackingConfidence = minHandTrackingConfidence
options.numHands = numHands

// Assign an object of the class to the `gestureRecognizerLiveStreamDelegate`
// property.
APPGestureRecognizerResultProcessor *processor =
  [APPGestureRecognizerResultProcessor new];
options.gestureRecognizerLiveStreamDelegate = processor;

MPPGestureRecognizer *gestureRecognizer =
      [[MPPGestureRecognizer alloc] initWithOptions:options error:nil];
    

Yapılandırma seçenekleri

Bu görev, iOS uygulamaları için aşağıdaki yapılandırma seçeneklerine sahiptir:

Seçenek Adı Açıklama Değer Aralığı Varsayılan Değer
runningMode Görevin çalışma modunu ayarlar. Üç mod vardır:

RESİM: Tek resimli girişler için mod.

VİDEO: Bir videonun kodu çözülmüş karelerine yönelik mod.

LIVE_STREAM: Kamera gibi giriş verilerini içeren bir canlı yayın modu. Bu modda, sonuçları eşzamansız olarak almak üzere bir işleyici ayarlamak için resultListener çağrılmalıdır. Bu modda gestureRecognizerLiveStreamDelegate, eşzamansız olarak hareket tanıma işleminin sonuçlarını almak için GestureRecognizerLiveStreamDelegate özelliğini uygulayan bir sınıfın bir örneğine ayarlanmalıdır.
{RunningMode.image, RunningMode.video, RunningMode.liveStream} RunningMode.image
num_hands GestureRecognizer, maksimum el sayısını algılayabilir. Any integer > 0 1
min_hand_detection_confidence El algılamasının, avuç içi algılama modelinde başarılı olarak değerlendirilebilmesi için gereken minimum güven puanı. 0.0 - 1.0 0.5
min_hand_presence_confidence El önemli nokta algılama modelinde el varlığının minimum güven puanı. Hareket Tanıma Aracı'nın Video ve Canlı yayın modunda, el önemli nokta modelindeki el varlığı güven puanı bu eşiğin altındaysa avuç içi algılama modelini tetikler. Aksi takdirde, daha sonraki önemli nokta tespiti için ellerin konumunu belirlemek üzere hafif bir el takip algoritması kullanılır. 0.0 - 1.0 0.5
min_tracking_confidence Elle izlemenin başarılı olarak kabul edilmesi için gereken minimum güven puanı. Bu, geçerli çerçevede ve son karede bulunan eller arasındaki sınırlayıcı kutu IoU eşiğidir. Hareket Tanıyıcı'nın Video ve Yayın modunda, izleme başarısız olursa Hareket Tanıyıcı el algılamayı tetikler. Aksi halde, el algılama özelliği atlanır. 0.0 - 1.0 0.5
canned_gestures_classifier_options Hazır hareketler sınıflandırıcı davranışını yapılandırma seçenekleri. Hazır hareketler: ["None", "Closed_Fist", "Open_Palm", "Pointing_Up", "Thumb_Down", "Thumb_Up", "Victory", "ILoveYou"]
  • Görünen adlar yerel ayarı: Varsa TFLite Model Meta Verileri aracılığıyla belirtilen görünen adlar için kullanılacak yerel ayar.
  • Maksimum sonuç: Döndürülecek en yüksek puanlı sınıflandırma sonuçlarının maksimum sayısı. < 0 ise mevcut tüm sonuçlar döndürülür.
  • Puan eşiği: Altına düşen sonuçların reddedildiği puan. 0 olarak ayarlanırsa mevcut tüm sonuçlar döndürülür.
  • Kategori izin verilenler listesi: Kategori adlarının izin verilenler listesi. Boş değilse kategorisi bu grupta bulunmayan sınıflandırma sonuçları filtrelenir. Reddetme listesi ile birlikte kullanılamaz.
  • Kategori ret listesi: Kategori adlarının ret listesi. Boş değilse kategorisi bu grupta yer alan sınıflandırma sonuçları filtrelenir. İzin verilenler listesi ile birlikte kullanılamaz.
    • Görünen adlar yerel ayarı: any string
    • Maksimum sonuçlar: any integer
    • Puan eşiği: 0.0-1.0
    • Kategori izin verilenler listesi: vector of strings
    • Kategori ret listesi: vector of strings
    • Görünen adlar yerel ayarı: "en"
    • Maksimum sonuçlar: -1
    • Puan eşiği: 0
    • Kategori izin verilenler listesi: boş
    • Kategori ret listesi: boş
    custom_gestures_classifier_options Özel hareketler sınıflandırıcı davranışını yapılandırma seçenekleri.
  • Görünen adlar yerel ayarı: Varsa TFLite Model Meta Verileri aracılığıyla belirtilen görünen adlar için kullanılacak yerel ayar.
  • Maksimum sonuç: Döndürülecek en yüksek puanlı sınıflandırma sonuçlarının maksimum sayısı. < 0 ise mevcut tüm sonuçlar döndürülür.
  • Puan eşiği: Altına düşen sonuçların reddedildiği puan. 0 olarak ayarlanırsa mevcut tüm sonuçlar döndürülür.
  • Kategori izin verilenler listesi: Kategori adlarının izin verilenler listesi. Boş değilse kategorisi bu grupta bulunmayan sınıflandırma sonuçları filtrelenir. Reddetme listesi ile birlikte kullanılamaz.
  • Kategori ret listesi: Kategori adlarının ret listesi. Boş değilse kategorisi bu grupta yer alan sınıflandırma sonuçları filtrelenir. İzin verilenler listesi ile birlikte kullanılamaz.
    • Görünen adlar yerel ayarı: any string
    • Maksimum sonuçlar: any integer
    • Puan eşiği: 0.0-1.0
    • Kategori izin verilenler listesi: vector of strings
    • Kategori ret listesi: vector of strings
    • Görünen adlar yerel ayarı: "en"
    • Maksimum sonuçlar: -1
    • Puan eşiği: 0
    • Kategori izin verilenler listesi: boş
    • Kategori ret listesi: boş
    result_listener Hareket tanıyıcı canlı yayın modundayken sınıflandırma sonuçlarını eşzamansız olarak almak için sonuç işleyiciyi ayarlar. Yalnızca çalıştırma modu LIVE_STREAM olarak ayarlandığında kullanılabilir ResultListener Yok Yok

    Koşu modu canlı yayın olarak ayarlandığında, Hareket Tanıyıcı için ek gestureRecognizerLiveStreamDelegate yapılandırma seçeneği gerekir. Bu seçenek, Hareket Tanımlayıcı'nın hareket tanıma sonuçlarını eşzamansız olarak sunmasını sağlar. Yetki verilmiş kullanıcının, Hareket Tanıma Aracı'nın her karede hareket tanıma işleminin sonuçlarını işledikten sonra çağırdığı gestureRecognizer(_:didFinishRecognition:timestampInMilliseconds:error:) yöntemini uygulaması gerekir.

    Seçenek adı Açıklama Değer Aralığı Varsayılan Değer
    gestureRecognizerLiveStreamDelegate Hareket Tanıma Aracı'nın, canlı yayın modunda hareket tanıma sonuçlarını eşzamansız olarak almasını sağlar. Örneği bu mülke ayarlanan sınıf, gestureRecognizer(_:didFinishRecognition:timestampInMilliseconds:error:) yöntemini uygulamalıdır. Geçerli değil Belirlenmedi

    Verileri hazırlama

    Giriş resmini veya çerçevesini Hareket Tanıma Aracı'na iletmeden önce bir MPImage nesnesine dönüştürmeniz gerekir. MPImage, farklı iOS görüntü biçimlerini destekler ve çıkarım için bunları herhangi bir çalışma modunda kullanabilir. MPImage hakkında daha fazla bilgi için MPImage API'yi inceleyin.

    Kullanım alanınıza ve uygulamanızın gerektirdiği çalışma moduna göre bir iOS görüntü biçimi seçin.MPImage; UIImage, CVPixelBuffer ve CMSampleBuffer iOS görüntü biçimlerini kabul eder.

    UIImage

    UIImage biçimi, aşağıdaki çalıştırma modları için uygundur:

    • Resimler: bir uygulama paketi, kullanıcı galerisi veya dosya sisteminden UIImage olarak biçimlendirilmiş resimler MPImage nesnesine dönüştürülebilir.

    • Videolar: AVAssetImageGenerator kullanarak video karelerini CGImage biçiminde ayıklayın ve UIImage görüntülerine dönüştürün.

    Swift

    // Load an image on the user's device as an iOS `UIImage` object.
    
    // Convert the `UIImage` object to a MediaPipe's Image object having the default
    // orientation `UIImage.Orientation.up`.
    let image = try MPImage(uiImage: image)
        

    Objective-C

    // Load an image on the user's device as an iOS `UIImage` object.
    
    // Convert the `UIImage` object to a MediaPipe's Image object having the default
    // orientation `UIImageOrientationUp`.
    MPImage *image = [[MPPImage alloc] initWithUIImage:image error:nil];
        

    Örnekte, varsayılan UIImage.Orientation.Up yönle bir MPImage başlatılır. Desteklenen UIImage.Orientation değerlerinden herhangi biriyle bir MPImage başlatabilirsiniz. Hareket Tanıyıcı .upMirrored, .downMirrored, .leftMirrored, .rightMirrored gibi yansıtılan yönleri desteklemez.

    UIImage hakkında daha fazla bilgi için UIImage Apple Developer Dokümanlar'a bakın.

    CVPixelBuffer

    CVPixelBuffer biçimi, çerçeveler oluşturan ve işleme amacıyla iOS CoreImage çerçevesini kullanan uygulamalar için uygundur.

    CVPixelBuffer biçimi, aşağıdaki çalıştırma modları için uygundur:

    • Resimler: iOS'in CoreImage çerçevesini kullanarak bir miktar işlemden sonra CVPixelBuffer resim oluşturan uygulamalar görüntü çalıştırma modunda Hareket Tanımlayıcı'ya gönderilebilir.

    • Videolar: Video kareleri, işlenmek üzere CVPixelBuffer biçimine dönüştürülebilir ve ardından video modundaki Hareket Tanımlayıcı'ya gönderilebilir.

    • Canlı yayın: Kare oluşturmak için iOS kamera kullanan uygulamalar, canlı yayın modundaki Hareket Tanımlayıcı'ya gönderilmeden önce işlenmek üzere CVPixelBuffer biçimine dönüştürülebilir.

    Swift

    // Obtain a CVPixelBuffer.
    
    // Convert the `CVPixelBuffer` object to a MediaPipe's Image object having the default
    // orientation `UIImage.Orientation.up`.
    let image = try MPImage(pixelBuffer: pixelBuffer)
        

    Objective-C

    // Obtain a CVPixelBuffer.
    
    // Convert the `CVPixelBuffer` object to a MediaPipe's Image object having the
    // default orientation `UIImageOrientationUp`.
    MPImage *image = [[MPPImage alloc] initWithUIImage:image error:nil];
        

    CVPixelBuffer hakkında daha fazla bilgi için CVPixelBuffer Apple Geliştirici Dokümanları'na bakın.

    CMSampleBuffer

    CMSampleBuffer biçimi, tek tip bir medya türünün medya örneklerini depolar ve canlı yayın çalıştırma modu için çok uygundur. iOS kameralardan alınan canlı kareler, iOS AVCaptureVideoDataOutput tarafından eşzamansız olarak CMSampleBuffer biçiminde yayınlanır.

    Swift

    // Obtain a CMSampleBuffer.
    
    // Convert the `CMSampleBuffer` object to a MediaPipe's Image object having the default
    // orientation `UIImage.Orientation.up`.
    let image = try MPImage(sampleBuffer: sampleBuffer)
        

    Objective-C

    // Obtain a `CMSampleBuffer`.
    
    // Convert the `CMSampleBuffer` object to a MediaPipe's Image object having the
    // default orientation `UIImageOrientationUp`.
    MPImage *image = [[MPPImage alloc] initWithSampleBuffer:sampleBuffer error:nil];
        

    CMSampleBuffer hakkında daha fazla bilgi için CMSampleBuffer Apple Geliştirici Dokümanları'na bakın.

    Görevi çalıştırma

    Hareket Tanıyıcı'yı çalıştırmak için atanan çalıştırma moduna özel recognize() yöntemini kullanın:

    • Hareketsiz resim: recognize(image:)
    • Video: recognize(videoFrame:timestampInMilliseconds:)
    • Canlı yayın: recognizeAsync(image:timestampInMilliseconds:)

    Aşağıdaki kod örneklerinde Hareket Tanıyıcı'nın bu farklı çalıştırma modlarında nasıl çalıştırılacağına ilişkin temel örnekler gösterilmektedir:

    Swift

    Resim

    let result = try gestureRecognizer.recognize(image: image)
        

    Video

    let result = try gestureRecognizer.recognize(
      videoFrame: image,
      timestampInMilliseconds: timestamp)
        

    Canlı yayın

    try gestureRecognizer.recognizeAsync(
      image: image,
      timestampInMilliseconds: timestamp)
        

    Objective-C

    Resim

      MPPGestureRecognizerResult *result =
        [gestureRecognizer recognizeImage:mppImage
                                    error:nil];
        

    Video

    MPPGestureRecognizerResult *result =
      [gestureRecognizer recognizeVideoFrame:image
                     timestampInMilliseconds:timestamp
                                       error:nil];
        

    Canlı yayın

    BOOL success =
      [gestureRecognizer recognizeAsyncImage:image
                     timestampInMilliseconds:timestamp
                                       error:nil];
        

    Örnek kod, kullanıcının, kullanım alanınız için gerekli olmayabilecek işleme modları arasında geçiş yapmasını sağlar.

    Aşağıdakileri göz önünde bulundurun:

    • Video modunda veya canlı yayın modunda çalışırken Hareket Tanıyıcı görevine giriş karesinin zaman damgasını da sağlamanız gerekir.

    • Hareket Tanımlayıcı görevi, resim veya video modunda çalışırken giriş resmini veya çerçevesini işlemeyi bitirene kadar mevcut iş parçacığını engeller. Mevcut iş parçacığının engellenmesini önlemek için işlemeyi iOS Dispatch veya NSOperation çerçevelerini kullanarak bir arka plan iş parçacığında yürütün.

    • Canlı yayın modunda çalışırken, Hareket Tanıyıcı görevi hemen geri gelir ve mevcut iş parçacığını engellemez. Her bir giriş çerçevesini işledikten sonra hareket tanıma sonucuyla gestureRecognizer(_:didFinishRecognition:timestampInMilliseconds:error:) yöntemini çağırır. Hareket Tanıma Aracı, bu yöntemi özel bir seri dağıtım sırasında eşzamansız olarak çağırır. Sonuçları kullanıcı arayüzünde görüntülemek için sonuçları işlendikten sonra ana sıraya gönderin. Hareket Tanıyıcı görevi başka bir kareyi işlemeyle meşgulken recognizeAsync işlevi çağrılırsa Hareket Tanıyıcı yeni giriş çerçevesini yoksayar.

    Sonuçları işleme ve görüntüleme

    Çıkarım yapıldığında, Hareket Tanıyıcı görevi; görüntü koordinatlarındaki el yer işaretlerini, dünya koordinatlarındaki el yerlerini, el kullanımını(sol/sağ el) ve algılanan ellerin el hareketi kategorilerini içeren bir GestureRecognizerResult döndürür.

    Aşağıda, bu görevden alınan çıkış verilerinin bir örneği gösterilmektedir:

    Sonuçta elde edilen GestureRecognizerResult, dört bileşen içerir ve her bileşen bir dizidir. Bu dizide her öğe, algılanan tek bir elin algılanan sonucunu içerir.

    • Uygun Olduğu El

      El bilgisi, algılanan ellerin sol el mi yoksa sağ el mi olduğunu belirtir.

    • Hareketler

      Algılanan ellerin tanınan hareket kategorileri.

    • Önemli noktalar

      Her biri x, y ve z koordinatlarından oluşan 21 önemli nokta vardır. x ve y koordinatları, sırasıyla resim genişliği ve yüksekliğine göre [0,0, 1,0] olacak şekilde normalleştirilir. z koordinatı, önemli nokta derinliğini temsil eder. Bilekteki derinlik ise başlangıç noktasıdır. Değer ne kadar küçükse nokta kameraya o kadar yakın olur. z ölçeğinin büyüklüğü, x ile yaklaşık olarak aynı ölçeği kullanır.

    • Dünyanın Sınırları

      21 önemli nokta, dünya koordinatlarında da gösterilir. Her önemli nokta, x, y ve z öğelerinden oluşur. Bu noktalar, başlangıç noktası elin geometrik merkezinde olmak üzere gerçek dünyadaki 3D koordinatları metre cinsinden temsil eder.

    GestureRecognizerResult:
      Handedness:
        Categories #0:
          index        : 0
          score        : 0.98396
          categoryName : Left
      Gestures:
        Categories #0:
          score        : 0.76893
          categoryName : Thumb_Up
      Landmarks:
        Landmark #0:
          x            : 0.638852
          y            : 0.671197
          z            : -3.41E-7
        Landmark #1:
          x            : 0.634599
          y            : 0.536441
          z            : -0.06984
        ... (21 landmarks for a hand)
      WorldLandmarks:
        Landmark #0:
          x            : 0.067485
          y            : 0.031084
          z            : 0.055223
        Landmark #1:
          x            : 0.063209
          y            : -0.00382
          z            : 0.020920
        ... (21 world landmarks for a hand)
    

    Aşağıdaki resimlerde görev çıktısının görselleştirmesi gösterilmektedir: