马斯克的 xAI 发布 Imagine v0.9，视频和音频一步搞定

2025/10/09 11:12:00

xAI 发布了一个新工具，叫 Imagine v0.9。它是一个 AI 模型，作用是根据文字生成视频。

这个新版本最大的变化，是它能同时处理画面和声音。以前的 AI 主要生成无声视频，声音需要后期添加。现在，Imagine v0.9 能在生成画面的同时，直接配上对应的声音。

这个模型具体能做什么，可以拆解为以下几点：

视频质量变好了。 相比旧版，画面的清晰度和细节有提升。
动作更连贯。 视频里的人和物体，动作看起来更自然，没有卡顿感。
声音是它自己创作的。 这是核心功能。它能生成三种声音：
- 环境音和背景音乐。
- 人说话的声音。 并且 AI 会确保口型能和声音对上。
- 歌曲。

它还有一些模仿专业拍摄的功能：

简单来说，这个工具的目标是让你只用文字，就能得到一个完整的视频。画面、声音、配乐、对话都一次性生成，不需要你再用其他软件去剪辑或配音。

总的来说，这个模型让 AI 视频生成变得更完整了。它把过去分离的视频和音频制作步骤，合并成了一步。

Last updated on 2025/10/09 11:12:00