马斯克的 xAI 发布 Imagine v0.9,视频和音频一步搞定
2025/10/09 11:12:00
xAI 发布了一个新工具,叫 Imagine v0.9。它是一个 AI 模型,作用是根据文字生成视频。
这个新版本最大的变化,是它能同时处理画面和声音。以前的 AI 主要生成无声视频,声音需要后期添加。现在,Imagine v0.9 能在生成画面的同时,直接配上对应的声音。
这个模型具体能做什么,可以拆解为以下几点:
视频质量变好了。 相比旧版,画面的清晰度和细节有提升。
动作更连贯。 视频里的人和物体,动作看起来更自然,没有卡顿感。
声音是它自己创作的。 这是核心功能。它能生成三种声音:
环境音和背景音乐。
人说话的声音。 并且 AI 会确保口型能和声音对上。
歌曲。
它还有一些模仿专业拍摄的功能:
自动运镜。 这个工具能模仿摄像机的运镜,比如自动对焦,或者调整景深,也就是让背景变模糊来突出主体。
感知节奏。 它能识别音乐的节拍,然后让视频里的角色跟着节奏移动,比如跳舞。
简单来说,这个工具的目标是让你只用文字,就能得到一个完整的视频。画面、声音、配乐、对话都一次性生成,不需要你再用其他软件去剪辑或配音。
总的来说,这个模型让 AI 视频生成变得更完整了。它把过去分离的视频和音频制作步骤,合并成了一步。
Last updated on