Dịch và lồng tiếng cho video của bạn sang ngôn ngữ bất kỳ.
Ý nghĩa
Langflip phụ thuộc nhiều vào API Đa phương thức Gemini. Thao tác này sẽ gửi video gốc đến Gemini và yêu cầu Gemini : 1. Tạo phụ đề cho video. Một trong những điểm phức tạp chính khi dịch video là duy trì nhịp độ của video gốc. Ví dụ: nếu chúng ta muốn dịch một video tiếng Anh sang tiếng Đức, thì rất có thể bản dịch sẽ có nhiều từ hơn và dài hơn video gốc. Gemini có khả năng phát hiện thời điểm người nói nghỉ giải lao và nhóm phụ đề cho đến khi có thời điểm nghỉ giải lao. 2. Tạo bản dịch, một lần nữa, chúng ta muốn duy trì nhịp độ của video gốc. Google Dịch sẽ cung cấp bản dịch theo nghĩa đen của các câu gốc. Tuy nhiên, chúng tôi muốn bản dịch có thời lượng gần bằng với video gốc. Gemini có thể tạo bản dịch có số lượng ký tự gần bằng với số lượng ký tự của câu gốc được dịch. 3. Phát hiện khung hình cần được đồng bộ hoá môi, chúng ta chỉ muốn gửi những khung hình mà người nói xuất hiện rõ ràng và đang nói chuyện với mô hình AI đồng bộ hoá môi. Nếu chúng ta gửi các khung không có khuôn mặt hiển thị đến AI, thì AI có thể gặp sự cố và không thực hiện được quá trình đồng bộ hoá môi. Gemini cung cấp khả năng gửi video và nhận tất cả dấu thời gian mà người nói xuất hiện trong video.
Được tạo bằng
Flutter
Firebase
Nhóm
Người cập nhật
Rémy Menard
Từ
Pháp
[[["Dễ hiểu","easyToUnderstand","thumb-up"],["Giúp tôi giải quyết được vấn đề","solvedMyProblem","thumb-up"],["Khác","otherUp","thumb-up"]],[["Thiếu thông tin tôi cần","missingTheInformationINeed","thumb-down"],["Quá phức tạp/quá nhiều bước","tooComplicatedTooManySteps","thumb-down"],["Đã lỗi thời","outOfDate","thumb-down"],["Vấn đề về bản dịch","translationIssue","thumb-down"],["Vấn đề về mẫu/mã","samplesCodeIssue","thumb-down"],["Khác","otherDown","thumb-down"]],[],[],[],null,["# LangFlip\n\n[More Apps](/competition/vote) \n\nLangFlip\n========\n\nTranslate \\& Lip-sync your videos into any language. \nVote \nVoted!\nWhat it does\n\nLangflip relies heavily on the Gemini Multimodal API. It will send the original video to Gemini and ask Gemini to : \n1. Generate captions for the videos, one of the main complexities of translating videos is maintaining the rhythm of the original video. For example, if we want to translate an English video into German, it is very likely that the translation will have more words and will be longer than the original video. Gemini gives the ability to detect when the speaker takes a break and group the caption until a break. \n2. Generate the translations, again, we want to maintain the rhythm of the original videos. Google Translate will provide a literal translation of the original sentences. However, we want translations that are more or less the same length as the original video. Gemini gives the ability to generate translations with more or less the same number of characters than the original sentence translated. \n3. Detect which frames need to be lip-synced, we want to send only the frames where the speaker is clearly visible and talking to the lip-syncing AI model. If we send frames with no visible face to the AI, it might crash and fail the lip-syncing process. Gemini provides the ability to send the video and receive all the timestamps where the speaker appears in the video. \nBuilt with\n\n- Flutter\n- Firebase \nTeam \nBy\n\nRémy Menard \nFrom\n\nFrance \n[](/competition/vote)"]]