11 DES 2024

Gemini Mendukung Pengalaman "Natural Language Computing" tldraw

Vishal Dharmadhikari

Product Solutions Engineer

Steve Ruiz

Tldraw

Memanfaatkan Interaksi Bahasa Natural dengan Gemini API

Gemini API memungkinkan developer mengintegrasikan kemampuan AI canggih ke dalam aplikasi mereka dengan lancar, sehingga membuka kemungkinan baru untuk pengalaman dan fungsi pengguna. Postingan ini menyoroti cara tldraw memanfaatkan Gemini untuk membangun pengalaman "pemrosesan bahasa alami" revolusioner dalam project barunya, computer. Hal ini menunjukkan kecepatan dan kemudahan startup dalam mengintegrasikan AI yang canggih menggunakan Gemini API dan SDK kanvas tldraw. Tim tldraw akan segera meluncurkan komputer dengan Gemini 1.5 Flash (bergabung dalam daftar tunggu) dan saat ini membuat prototipe dengan Gemini 2.0 Flash untuk iterasi mendatang.

tldraw menggunakan Gemini API untuk menghadirkan kecanggihan AI percakapan ke pemrograman visual, sehingga pengguna dapat membuat konten dan memproses informasi menggunakan bahasa alami. Hal ini membuka peluang menarik untuk pengalaman pengguna yang lebih intuitif dan efisien seputar AI, sehingga mendorong batas komunikasi visual.

Visi di Balik Komputer

tldraw, yang berupaya membuat pembuatan diagram dapat diakses dan intuitif, membayangkan cara yang lebih alami bagi pengguna untuk berinteraksi dengan kanvas mereka. Pendiri Steve Ruiz berupaya memanfaatkan kemampuan SDK kanvas tak terbatas tldraw untuk menciptakan lingkungan dinamis dalam bekerja dengan AI generatif. Visi ini mendorong pengembangan computer, sebuah aplikasi eksperimental tempat pengguna membuat alur kerja dari blok teks, gambar, dan petunjuk. Saat dijalankan, informasi mengalir dari satu komponen ke komponen berikutnya, dengan output setiap generasi berfungsi sebagai input ke generasi berikutnya, sehingga menciptakan proses canggih yang bercabang, berulang, dan beriterasi untuk menghasilkan output.

Membangun dengan Gemini 2.0: Mempelajari Komputer Secara Mendalam

Komputer tldraw dibangun di atas jaringan “komponen” yang saling terhubung yang merepresentasikan elemen di kanvas (kotak teks, gambar, klip audio, dll.). Komponen ini dihubungkan oleh panah, yang memvisualisasikan aliran data dan transformasi. Setiap komponen memiliki "prosedur" terkait—kumpulan petunjuk yang dijalankan berdasarkan input dari komponen yang terhubung. Komponen dapat menerima data dari sejumlah komponen lain dan meneruskan data outputnya ke banyak komponen lain—termasuk dirinya sendiri. Arsitektur berbasis komponen ini, jika dikombinasikan dengan kemampuan dan kecepatan Gemini 2.0 Flash, memungkinkan sistem yang cepat dan fleksibel yang mampu menangani berbagai tugas.

Pemrograman visual AI komputer tldraw dengan pembuatan teks menggunakan Gemini 2.0 dan pembuatan gambar dengan model pembuatan gambar

Berikut cara pembuatan prototipe Gemini 2.0 Flash mendukung pengalaman:

Eksekusi Prosedur Secepat Kilat: Gemini 2.0 Flash mengeksekusi prosedur dengan cepat. Misalnya, komponen "Petunjuk" dapat berisi "Tulis iklan singkat". Dalam beberapa saat setelah dipicu, komponen akan menghasilkan skrip langkah-langkah yang dapat digunakan kembali yang dapat mengubah kombinasi input apa pun menjadi skrip komersial. Komponen kemudian akan menggunakan skrip ini, bersama dengan input saat ini (misalnya, komponen "Teks" dengan "Sarung tangan pintar baru berteknologi AI untuk kucing"), untuk membuat perintah kedua ke model untuk output akhirnya. Output ini dapat diteruskan ke komponen "Teks" tertaut lainnya untuk ditampilkan, serta komponen terhubung lainnya, seperti "Ucapan" untuk text-to-speech, "Gambar" untuk pembuatan visual, atau komponen “Petunjuk” lainnya untuk transformasi lebih lanjut.
Banyak Konteks, Banyak Mode: Kecenderungan maksimalis dalam komputer tldraw memerlukan kecepatan, kapasitas, dan kemampuan. Dengan beberapa komponen yang menyediakan data untuk setiap generasi, jendela konteks besar Gemini 2.0 Flash sangat penting untuk menghasilkan output yang mempertimbangkan semua input, seperti halnya dukungan untuk gambar dan file bersama dengan perintah tertulis.
Data Terstruktur: Aliran data antar-komponen tidak akan mungkin terjadi tanpa kepatuhan terhadap satu skema. Output JSON terstruktur dari Gemini 2.0 Flash memastikan bahwa setiap komponen dalam alur kerja dapat mengenali data jenis apa pun dan menghasilkan outputnya dalam struktur yang sama, sehingga mencegah penundaan, memperlancar eksekusi, dan memastikan alur kerja yang besar sekalipun akan selesai dengan andal.
Pembuatan Prosedur Dinamis: Selain mengeksekusi prosedur yang telah ditentukan sebelumnya, Gemini 2.0 Flash dapat membuat prosedur secara dinamis. Pengguna dapat memasukkan "buat kampanye pemasaran berdasarkan deskripsi produk ini", dan Gemini 2.0 Flash akan membuat langkah-langkah (prosedur) yang diperlukan dan komponen yang diperlukan, serta membangun alur kerja di kanvas berdasarkan permintaan tingkat tinggi pengguna. Pembuatan dinamis ini membuka potensi besar untuk pengalaman pengguna yang inovatif dan alur kerja yang lancar.

Solusi Cepat untuk Inovasi

Implementasi cepat tldraw menyoroti proposisi nilai Gemini untuk startup: pembuatan prototipe yang cepat, peningkatan pengalaman pengguna melalui antarmuka bahasa alami yang intuitif, dan penanganan data terstruktur yang efisien berkat model seperti Gemini 2.0 Flash. Kombinasi ini memungkinkan tim kecil membuat fitur inovatif yang didukung AI dengan cepat dan hemat biaya.

“Kami ingin menunjukkan bahwa tim mana pun dapat membuat project ambisius dengan SDK kanvas tldraw. Gemini Flash adalah mesin yang sempurna untuk alat alur kerja berbasis kanvas yang cepat dan multimodal. Dengan Gemini 2.0 dan mungkin nama yang lebih baik, saya yakin kita bisa menawarkan komputer sebagai startup tersendiri besok.”

— Steve Ruiz, Pendiri tldraw

Memberdayakan Aplikasi Anda dengan Gemini API

Terinspirasi oleh kesuksesan tldraw? Gemini API menawarkan model canggih seperti Gemini 1.5 Pro, Gemini 1.5 Flash, dan kini Gemini 2.0 Flash sebagai model pratinjau eksperimental untuk menghadirkan fitur AI inovatif ke aplikasi Anda. Pelajari dokumentasi Gemini API dan berikan kemampuan AI kepada pengguna Anda.

Untuk profesional kreatif, developer, dan tim dari segala jenis, tldraw menawarkan platform unik dan canggih untuk mewujudkan ide. Bergabung ke daftar tunggu komputer. Rasakan masa depan kolaborasi visual sekarang.