Visibl
Visibl biến sách nói thành sách nói dạng video
Ý nghĩa
Visibl là một ứng dụng iOS giúp biến sách nói thành sách nói dạng video sống động, biến trải nghiệm nghe của bạn thành một hành trình hình ảnh. Khi bạn nghe, Visibl sẽ tự động tạo hình ảnh theo thời gian thực, cho phép người dùng xem cách diễn giải hình ảnh độc đáo về cuốn sách nói mà họ đang thưởng thức. Ứng dụng này không chỉ tạo hình ảnh tĩnh mà còn cho phép người dùng tác động và định hướng hình ảnh, giúp mỗi hành trình đọc sách trở nên rất cá nhân hoá.
Visibl tận dụng sức mạnh của API Gemini theo 3 cách chính:
- Bản chép lời âm thanh: Ứng dụng chép lời bản âm thanh sách nói thành văn bản, đảm bảo nội dung được trình bày chính xác.
- Nhận dạng thực thể được đặt tên (NER): Tính năng này cho phép ứng dụng xác định và tập trung vào các nhân vật, địa điểm và đối tượng chính trong văn bản. Đây là những yếu tố quan trọng để tạo hình ảnh phù hợp theo ngữ cảnh (Gemini 1.5 Pro)
- Tạo câu lệnh hình ảnh: Bằng cách sử dụng thông tin chi tiết từ bản chép lời và NER, ứng dụng sẽ tạo câu lệnh hình ảnh chi tiết và được cá nhân hoá. Sau đó, các mô hình lan truyền sẽ sử dụng câu lệnh này để tạo hình ảnh theo thời gian thực. (Gemini 1.5 Pro)
Sự kết hợp các tính năng của API Gemini này đảm bảo rằng Visibl không chỉ cung cấp một cách mới mẻ để trải nghiệm sách nói mà còn điều chỉnh trải nghiệm phù hợp với từng người dùng.
Được tạo bằng
- Firebase
Nhóm
Người cập nhật
visibl
Từ
Vương quốc Anh