Pixtale

借助 Gemini 的 AI 魔法,您可以将行程照片转换为有旁白的视频,只需几分钟的时间。

作用

Pixtale 是一款 AI 赋能的应用,可将您的旅行照片和视频转换为有声视频故事。具体操作步骤如下:
1. 上传:用户上传包含行程媒体内容的 ZIP 文件,或选择 Google 相册影集。
2. 元数据提取:该应用会从媒体中提取日期、时间和 GPS 数据。
3. AI 描述生成:这是 Gemini API 的强项:
- Gemini Flash 会为单张照片和视频生成说明。
- Gemini 1.5 Pro 会将这些说明作为输入,并逐个场景制作出连贯的叙述脚本。
4. 音频旁白:Google 的 Text-to-Speech API 会将脚本转换为音频。
5. 视频制作:FFmpeg 将旁白与原始媒体内容合并,以制作最终视频。
6. 社交媒体内容:Pixtale 还可以生成:
- 用于分享的文字说明和标签
- 总结行程的简短博文(也使用 Gemini 1.5 Pro)
7. 用户自定义:用户可以使用 Google 地图 API 修改每个场景的位置详细信息。
Pixtale 利用 Gemini 的功能来解读视觉数据、理解情境、生成连贯且富有吸引力的内容,并打造贴合个人风格且真实可信的叙事。这种 AI 赋能的创作方式可快速制作富媒体旅行故事,而手动制作则非常耗时。

可采用以下设备打造

  • Google Photos Library API
  • Google 地图 API

团队

更新者

Pixtale

发件人

美国