Google uses AI technology to translate content into your preferred language. AI translations can contain errors.

梦幻：AI 童话

AI 童话故事：使用 Google API 为儿童创作视频故事。

作用

我创建了一个系统，该系统使用 Google 的最新 AI 模型 Gemini 为儿童生成视频故事。AI 模型会创建故事和图片提示，然后将其传递给 Mini DALL-E，后者由 Hugging Face 上的 Google TPU Research Cloud 提供支持。后端使用 Python 3、FastAPI 和 Uvicorn 构建而成。创建图片后，系统会使用安装在 Contabo 托管的机器上的 /coqui-ai/TTS 处理故事文本，以生成与视频时长匹配的 WAV/MP3 文件。所有元素都使用 MoviePy 合并，并返回给用户。用户通过 POST 端点进行互动，该端点接受一个或多个字符的提示，并返回生成的视频，这些视频存储为静态文件。在发生失败或视频超过 30 天时，后台作业会清理空间。前端采用 React Native 构建，界面简单，包含视频播放器、首页上的随机生成按钮，以及“创建”页面上的自定义生成选项，最多支持两个字符，或从列表中选择一个字符。该应用专为儿童或监督者使用，目前正在测试中，预计很快就会在 Play 商店中发布正式版。

可采用以下设备打造

Android
Mini DALL-E
由 Hugging Face 上的 Google TPU Research Cloud 提供支持。

团队

更新者

Babastars

发件人

美国