Google Gemini 人工智能 • 本地音频 • 电影级视频控制
体验谷歌的Gemini Omni AI视频生成模型。将文字描述、图片或视频片段转化为迷人的电影级作品,并配有原生音频输出。支持多种视频时长、最高1080p分辨率,以及适配任何平台画面比例的宽高比。
谷歌的Gemini Omni带来前沿的多模态AI视频生成功能,支持原生音频与电影级别的可控性。
Gemini Omni 支持输入文字提示、参考图片(最多7张)或视频片段。融合多种模态,带来极致创意掌控:从零以文字生成素材、让参考图片动起来,或将现有视频转变为全新电影级场景。
与传统的视频模型不同,Gemini Omni(双子星全能)能够原生地同步生成与视频匹配的音频。无需独立的音频编辑,即可获得与视觉内容完美契合的丰富环境音、音乐和音效。
通过详细的文本提示,实现摄影机运镜、灯光效果和动态运动的精准操控。Gemini Omni 理解复杂的电影摄制指令,为营销、内容创作和叙事呈现等场景,产出专业级别的优质结果。
可选时长包括4秒、6秒、8秒或10秒,分辨率可选720p(3积分/秒)或1080p(9积分/秒)。支持16:9和9:16画面比例,完美适配YouTube、TikTok、Instagram及电影级视觉呈现。
使用Gemini Omni只需几分钟即可生成专业级AI视频。选择你的输入方式,剩下的交给AI来处理。
选择文字转视频模式,用文本描述场景;选择图片转视频模式,可上传最多7张参考图片;选择视频转视频模式,可改造现有视频片段。每种模式都提供不同的创意可能性。
设置所需时长(4秒、6秒、8秒或10秒)、分辨率(720p生成更快,1080p画质最高)以及宽高比(16:9横屏或9:16竖屏/手机模式)。积分按每秒的分辨率计算。
点击生成,让 Gemini Omni 处理你的请求。该模型会生成带原生音频输出的视频,始终保持电影级画质。预览结果后即可下载,视频可直接在任何平台上使用。