Gemini, tldraw'ın "Doğal Dil İşleme" deneyimine güç katıyor

Vishal Dharmadhikari

Ürün Çözümleri Mühendisi

Steve Ruiz

Tldraw

Gemini API ile doğal dil etkileşimlerinden yararlanma

Gemini API, geliştiricilerin gelişmiş yapay zeka özelliklerini uygulamalarına sorunsuz bir şekilde entegre etmelerini sağlayarak kullanıcı deneyimi ve işlevsellik açısından yeni olanakların önünü açar. Bu gönderide, tldraw'ın yeni projesi computer'da devrim niteliğinde bir "doğal dil işlem" deneyimi oluşturmak için Gemini'dan nasıl yararlandığı açıklanmaktadır. Bu, Gemini API ve tldraw'ın canvas SDK'sı kullanılarak güçlü yapay zekanın startup'lar tarafından ne kadar hızlı ve kolay bir şekilde entegre edilebileceğini gösteriyor. tldraw ekibi yakında Gemini 1.5 Flash ile bilgisayar lansmanı yapacak (bekleme listesine katılın) ve gelecekteki yinelemeler için şu anda Gemini 2.0 Flash ile prototip oluşturuyor.

tldraw, Gemini API'yi kullanarak görsel programlamaya yapay zeka ile sohbet etme gücünü getiriyor. Bu sayede kullanıcılar, doğal dili kullanarak içerik oluşturabiliyor ve bilgileri işleyebiliyor. Bu, yapay zeka ile ilgili daha sezgisel ve verimli bir kullanıcı deneyimi için heyecan verici fırsatlar sunarak görsel iletişimin sınırlarını zorlar.

Bilgisayarın Arkasındaki Vizyon

tldraw, diyagram oluşturmayı erişilebilir ve sezgisel hale getirmek için kullanıcıların tuvalle etkileşim kurmasının daha doğal bir yolunu tasarladı. Kurucu Steve Ruiz, üretken yapay zekayla çalışmak için dinamik bir ortam oluşturmak üzere tldraw'ın sonsuz tuval SDK'sının gücünden yararlanmak istedi. Bu vizyon, kullanıcıların metin, resim ve talimat bloklarından iş akışları oluşturduğu deneysel bir uygulama olan computer'ın geliştirilmesine yol açtı. Çalıştırıldığında bilgiler bir bileşenden diğerine akar. Her üretimin çıktısı, bir sonraki üretimin girişi olarak kullanılır. Böylece, çıktılar üretmek için dallanan, döngüye giren ve tekrarlanan güçlü süreçler oluşturulur.

Gemini 2.0 ile geliştirme: Bilgisayar hakkında ayrıntılı bilgi

tldraw'un bilgisayarı, tuvaldeki öğeleri (metin kutuları, resimler, ses klipleri vb.) temsil eden birbirine bağlı "bileşenlerden" oluşan bir ağ üzerine kurulmuştur. Bu bileşenler, veri akışını ve dönüşümleri görselleştiren oklarla birbirine bağlanır. Her bileşenin ilişkili "prosedürleri" vardır. Bu prosedürler, bağlı bileşenlerden gelen girişlere göre yürütülen talimat kümeleridir. Bir bileşen, herhangi bir sayıda başka bileşenden veri kabul edebilir ve çıkış verilerini kendisi de dahil olmak üzere birçok başka bileşene iletebilir. Bu bileşen tabanlı mimari, Gemini 2.0 Flash'in gücü ve hızıyla birleşerek çeşitli görevleri yerine getirebilen hızlı ve esnek bir sistem oluşturur.

Gemini 2.0 ile metin oluşturma ve görüntü üretme modeliyle görüntü oluşturma kullanarak tldraw bilgisayarının yapay zeka ile görsel programlaması

Gemini 2.0 Flash prototipleme, deneyimi şu şekilde destekledi:

Yıldırım Hızında Prosedür Yürütme: Gemini 2.0 Flash, prosedürleri hızlı bir şekilde yürütür. Örneğin, bir "Talimat" bileşeni "Kısa bir reklam yaz" ifadesini içerebilir. Tetiklenmesinden kısa bir süre sonra bileşen, herhangi bir giriş kombinasyonunu ticari bir komut dosyasına dönüştürebilen, yeniden kullanılabilir bir adım komut dosyası oluşturur. Bileşen daha sonra bu komut dosyasını mevcut girişleriyle (ör. "Kediler için yeni yapay zeka destekli akıllı eldivenler" içeren bir "Metin" bileşeni) birlikte kullanarak nihai çıkışı için modele ikinci bir istem oluşturur. Bu çıkış, görüntüleme için başka bir bağlı "Metin" bileşenine ve diğer bağlı bileşenlere (ör. metin okuma için "Konuşma", görsel oluşturma için "Resim" veya daha fazla dönüştürme için diğer "Talimat" bileşenleri) aktarılabilir.
Çok Bağlam, Çok Mod: tldraw'un bilgisayarındaki maksimalist yaklaşım hız, kapasite ve yetenek gerektiriyordu. Her nesil için veri sağlayan birden fazla bileşenle birlikte Gemini 2.0 Flash'in büyük bağlam penceresi, tüm girişleri dikkate alan çıkışlar üretmek için kritik öneme sahipti. Ayrıca, yazılı istemlerin yanı sıra resim ve dosyaları da desteklemesi önemliydi.
Yapılandırılmış Veriler: Tek bir şemaya uyulmadığı takdirde bileşenler arasındaki veri akışı mümkün olmaz. Gemini 2.0 Flash'in yapılandırılmış JSON çıkışı, iş akışındaki her bileşenin her türden veriyi tanıyabilmesini ve çıkışlarını aynı yapıda üretebilmesini sağlar. Bu sayede duraksamalar önlenir, yürütme sorunsuz hale gelir ve büyük iş akışlarının bile güvenilir bir şekilde tamamlanması sağlanır.
Dinamik Prosedür Oluşturma: Gemini 2.0 Flash, önceden tanımlanmış prosedürleri yürütmenin yanı sıra prosedürleri dinamik olarak da oluşturabilir. Kullanıcılar "Bu ürün açıklamasına dayalı bir pazarlama kampanyası oluştur" yazabilir. Gemini 2.0 Flash, gerekli adımları (prosedürler) ve bileşenleri oluşturarak kullanıcının üst düzey isteğine göre tuvalde bir iş akışı oluşturur. Bu dinamik oluşturma, yenilikçi kullanıcı deneyimleri ve kolaylaştırılmış iş akışları için muazzam bir potansiyel sunar.

Yenilik için Hızlı Bir Galibiyet

tldraw'ın hızlı bir şekilde uygulanması, Gemini'ın startup'lar için değer önerisini vurguluyor: hızlı prototip oluşturma, sezgisel doğal dil arayüzleri aracılığıyla gelişmiş kullanıcı deneyimi ve Gemini 2.0 Flash gibi modeller sayesinde verimli yapılandırılmış veri işleme. Bu kombinasyon, küçük ekiplerin yenilikçi ve yapay zeka destekli özellikleri hızlı ve uygun maliyetli bir şekilde oluşturmasını sağlar.

"Her ekibin tldraw'un tuval SDK'sı ile iddialı projeler oluşturabileceğini göstermek istiyoruz. Gemini Flash, hızlı, çok formatlı ve tuval tabanlı bir iş akışı aracı için mükemmel bir motordu. Gemini 2.0 ve belki daha iyi bir adla, yarın bilgisayarı kendi başına bir startup olarak tanıtabileceğimizden eminim."

— Steve Ruiz, tldraw'un kurucusu

Uygulamanızı Gemini API ile Güçlendirme

tldraw'ın başarısından mı ilham aldınız? Gemini API, uygulamanıza yenilikçi yapay zeka özellikleri getirmek için Gemini 1.5 Pro, Gemini 1.5 Flash ve deneysel önizleme modeli olarak Gemini 2.0 Flash gibi güçlü modeller sunar. Gemini API belgelerini inceleyin ve kullanıcılarınıza yapay zeka gücü katın.

tldraw, yaratıcı profesyoneller, geliştiriciler ve her türden ekip için fikirleri hayata geçirebilecekleri benzersiz ve güçlü bir platform sunar. Bilgisayar bekleme listesine katılın. Görsel ortak çalışmanın geleceğini bugünden deneyimleyin.