SecondEye

Etkileşimli ve eğitilebilir görsel asistanınız

Ne işe yarar?

SecondEye, etkileşimli ve eğitilebilir bir görsel asistandır. Görmeyle ilgili çeşitli görevler ve kullanım alanları için kullanılabilir. Ayrıca, eğitim veya programlama olmadan kişiselleştirilmiş görüntüleme görevlerini gerçekleştirmesi de öğretilebilir. Tüm bunlar etkileşimli ve iteratif bir şekilde yapılır.
SecondEye şu anda yalnızca Gemini ile oluşturulabilir. Bunun nedeni, aşağıdaki modelin benzersiz özellikleridir:
1. Doğru sınırlayıcı kutu konumları döndürme özelliğine sahip nesne algılama
2. Zaman damgalı bilgiler döndürme özelliğine sahip doğal video desteği
3. Geniş bağlam penceresi
SecondEye, bu özellikleri kullanarak benzersiz ve tamamen yeni yapay zeka deneyimleri sunar:
• Resimler için (1. özellik kullanılır):
◦ Açıklanmış nesne tanımları
◦ Resmin belirli bir kısmı hakkında soru sorma
◦ Geliştirme:
▪ Nesne arama
▪ Onarım veya montajla ilgili sorular
▪ Görsel geri bildirim istekleri
◦ Modele bir resmin açıklanmış bir kısmını öğretme
• Video için (2. özellik kullanılır):
◦ Geliştirilmiş video arama deneyimi
• Canlı kamera videosu için (3. özellik kullanılır):
◦ Kişiselleştirilmiş gerçek zamanlı video analizi
◦ Modele videoyla bir şey öğretme
◦ Görme engelli kişiler için gerçek zamanlı görsel yardım (yüzleri, nesneleri ve yerleri ezberleyerek gelecekte tanıyabilirler).
• Canlı ekran paylaşımı için (3.özellik kullanılarak):
◦ Modele iş akışı öğretme
◦ BT veya programlama desteği
◦ Görme engelli kullanıcılar için web'de gezinme ve genel bilgisayar deneyimini iyileştirme

Aşağıdakilerle tasarlandı:

  • Web/Chrome
  • Firebase
  • Firebase Genkit
  • Google Speech-to-Text/Text-to-Speech

Takım

Değişikliği yapan

Zakaria KADDARI

Nereden

Fas