梦幻:AI 童话
AI 童话故事:使用 Google API 为儿童创作视频故事。
作用
我创建了一个系统,该系统使用 Google 的最新 AI 模型 Gemini 为儿童生成视频故事。AI 模型会创建故事和图片提示,然后将其传递给 Mini DALL-E,后者由 Hugging Face 上的 Google TPU Research Cloud 提供支持。后端是使用 Python 3、FastAPI 和 Uvicorn 构建的。创建图片后,系统会使用安装在 Contabo 托管的机器上的 /coqui-ai/TTS 处理故事文本,以生成与视频时长匹配的 WAV/MP3 文件。所有元素都使用 MoviePy 合并,并返回给用户。用户通过 POST 端点进行互动,该端点接受一个或多个字符的提示,并返回生成的视频(存储为静态文件)。在发生失败或视频超过 30 天时,后台作业会清理空间。前端采用 React Native 构建,界面简单,包含视频播放器、首页上的随机生成按钮,以及“创建”页面上的自定义生成选项,支持最多两个字符或从列表中预选的字符。该应用专为儿童或监督者使用,目前正在测试中,预计很快就会在 Play 商店中发布正式版。
可采用以下设备打造
- Android
- Mini DALL-E
- 由 Hugging Face 上的 Google TPU Research Cloud 提供支持。
团队
更新者
Babastars
发件人
美国