AI 音乐视频片段生成器

脚本生成视频

输入一段画面提示词或上传一张参考图,两分钟内拿到电影感 MV 片段 — 由 Veo 3.1 Fast 和 Seedance Pro Fast 驱动。

参考图可选
上传参考图
提示词0/1500

按 Ctrl/Cmd + Enter 快速生成。首次生成通常需要 30-90 秒。

  • Veo 3.1 Fast 文生视频
  • Seedance Pro Fast 图生视频
  • 最长 12 秒电影感片段
  • 支持 16:9 / 9:16 / 1:1 画幅
  • 单次生成 30–90 秒
  • 为 MV B-roll 量身调校

什么是脚本生成视频?

一个聚焦的 AI 工具,把一段画面提示词或参考图变成可下载的 MV 片段。

脚本生成视频是一款聚焦的 AI 视频工具,把一段画面提示词变成一段完整、可下载的音乐视频片段。输入一段简短描述 — 一种情绪、一个场景、一个动作 — 选择模型和画幅,工具在 30 到 90 秒内返回一段电影感片段。不用搭分镜,不用逐段点击,不用维护项目文件。它为你已经想清楚「这一镜应该长什么样」、只差把它渲染出来的那个时刻而生。

这款脚本生成视频工具把目前最好的两个 AI 视频模型搭配在一起。Veo 3.1 Fast 负责文生视频:用自然语言描述画面,返回带运动、灯光和景深的电影感片段。Seedance Pro Fast 负责图生视频:上传一张静态图 — 一张角色图、一张 Nano Banana 渲染、上一段片段的一帧 — 让这一帧带着真实的运动动起来。两个模型都输出标准 MP4 文件,可以直接丢进任何剪辑软件、社交平台或演唱会背景系统。

在 GetLyricVideo 工作流中,脚本生成视频位于音乐视频脚本生成器的下一步。脚本生成器产出整首歌的时间轴蓝图 — 场景描述、图片提示词、视频提示词。本工具就是你想真正把其中某个场景生产成片段时使用的工具。从脚本 JSON 中粘贴一段场景,或者跳过脚本直接输入新提示词都可以。每次运行只产出一段片段,不是完整视频 — 节奏、选择和最终剪辑完全由你掌控。

A generated music video clip preview with prompt, reference image, and rendered MP4 frame
单片段预览:左侧是提示词和参考图,右侧是渲染好的 MP4 帧,可以直接拖进你的歌词视频时间轴。

一次生成包含哪些输入

六个输入决定片段长什么样。把它们写清楚,模型就有了一切所需的信息。

脚本生成视频工具的每次运行接收六个输入。每个输入控制结果的一个维度 — 主体、构图、运动、格式。下面是每个字段的作用,以及当你不确定时应该怎么写。

1

提示词(Prompt)

用自然语言描述画面。包括主体、场景、灯光、镜头运动和情绪。这是最重要的输入 — 模型会逐字读取它。

Example: 电影感雨夜东京街头,穿皮夹克的短发女孩回头望,霓虹在水坑里倒影,缓慢手持推镜头,琥珀与青色配色。

2

参考图(Reference Image)

可选的静态图,作为图生视频模式的视觉锚点。Seedance Pro Fast 把这张图当作首帧并在其上生成运动。Veo 3.1 Fast 忽略它。

Example: 脚本生成器产出的 9:16 主角立绘,或上一段片段里你想要延伸的一帧。

3

模型(Model)

决定生成管线。Veo 3.1 Fast 做纯文生视频,Seedance Pro Fast 在你已经有图时做图生视频。模型选择也影响每段片段的积分成本。

Example: 全新建一个空镜用 Veo 3.1 Fast。手里有角色图想让它动起来用 Seedance Pro Fast。

4

画幅(Aspect Ratio)

输出画面的形状。16:9 用于 YouTube 和横屏,9:16 用于 TikTok、Reels、Shorts,1:1 用于方形社交动态。跟着片段最终发布的位置选。

Example: Instagram Reels 预告用 9:16 竖屏。YouTube MV B-roll 用 16:9 横屏。

5

时长(Duration)

最终片段的时长。多数生成在 5 到 12 秒之间。短片段渲染更快、积分更省;长片段给镜头运动和故事节拍更多空间。

Example: 8 秒适合一句歌词的 B-roll。12 秒适合带多个节拍的开场空镜。

6

输出(Output)

交付物:一个标准 MP4 文件,按所选画幅和时长输出。下载,丢进任何剪辑软件,或者把多段片段排队拼成完整 MV。

Example: MP4,1080p,16:9,8 秒。可直接用于 DaVinci Resolve、Premiere、剪映,或直接上传。

工作流程

四步从灵感到可下载片段。

Step 1

描述你的画面

输入一段简短提示词,描述你想要的 MV 瞬间 — 一种情绪、一个场景、一个动作。脚本生成视频工具完全读得懂自然语言,像和摄影师讲话一样写就行。

提示词:电影感雨夜街头,穿皮夹克的短发女孩回头望,缓慢手持推镜头,琥珀与青色配色,9:16。

Tip: 把主体和镜头运动放在最前面。「特写,缓慢推镜头」比「大全景全屏」更容易被模型吃准。

Step 2

选择模型与画幅

用 Veo 3.1 Fast 做纯文生视频,或上传参考图切换到 Seedance Pro Fast 做图生视频。选择画幅(16:9、9:16 或 1:1)和时长(5–12 秒)。

从零开始做全新场景用 Veo 3.1 Fast。手里有一帧想让它动起来用 Seedance Pro Fast。

Tip: 画幅跟着发布平台走。TikTok 和 Reels 用 9:16,YouTube 用 16:9。同一提示词跑多个画幅没问题,模型会干净地重跑一次。

Step 3

生成并预览

点击生成按钮。多数片段 30 到 90 秒完成,具体看模型和时长。结果页有实时状态,先预览 MP4 再决定保留还是重试。

结果页展示渲染好的片段、所用提示词和下载按钮。没有黑盒队列,不用等邮件。

Tip: 如果片段接近但不够好,改一个更精确的提示词重试,不要推倒重来。微调几个词(加「浅景深」,去掉「大全景」)通常第二次就能命中。

Step 4

下载并任意场景使用

输出是标准 MP4。拖进歌词视频时间轴、发到 TikTok 或 Reels 当预告、排队多段做演唱会背景,或配合我们的合成工具加上音频做成完整 MV。

下载 → 拖进 DaVinci Resolve → 对齐音频 → 导出最终 MV。或者跳过剪辑直接上传到社交平台。

Tip: 保存好用的提示词。粘贴一条验证过的提示词再做小改动,是给同一项目快速生成一组风格统一片段的最快方法。

两种生成模式,两种不同的起点

有歌词灵感时选文生视频。已经有一帧画面时选图生视频。

Veo 3.1 Fast preview

Veo 3.1 Fast

最适合:用文字提示词生成电影感场景

文生视频,无需参考图

Veo 3.1 Fast 是脚本生成视频工具的文生视频模式。用自然语言描述画面 — 主体、场景、灯光、镜头运动 — 模型返回电影感片段,无需输入图。当你从一句歌词、一种情绪、或脚本生成器的一条提示词出发,想看模型能发明出什么时,选它最合适。

Output: 8 秒 MP4 片段,16:9 横屏或 9:16 竖屏 — 每次生成 28 积分

Seedance Pro Fast preview

Seedance Pro Fast

最适合:让一帧静态图带着真实运动动起来

图生视频,需要参考图

Seedance Pro Fast 是脚本生成视频工具的图生视频模式。上传一张静态图 — Nano Banana 角色渲染、上一段片段的一帧、一张图库照片 — 模型在这张图上生成真实运动。当你已经有视觉锚点想保留,或文生视频总是给出错误主角时,选它。

Output: 5–12 秒 MP4 片段,16:9、9:16 或 1:1 — 按时长 14 到 42 积分

看看你生成的片段长什么样

以下是脚本生成视频工具对单条场景提示词返回的示例结果。

Generated cinematic music video clip preview
片段已就绪

Scene 03

雨夜副歌特写

我仍然奔向你名字里的回声

Generated clip

A finished MP4-style result preview with the same prompt, model, aspect ratio, and duration surfaced on the result page.

Model

Veo 3.1 Fast

Format

16:9

Duration

8s

Cost

28 credits

Result pageMP4 ready

Preview the clip, download it, or retry once if the motion does not match the scene.

图片提示词

Cinematic rain-soaked street, neon signs, wet pavement reflections, emotional chorus close-up, teal and amber music video lighting.

视频提示词

Slow handheld push-in as the performer turns toward camera; subtle hair movement, rippling reflections, timed to the chorus beat.

脚本生成视频工具的实际输出是可下载的 MP4 片段。结果页还会展示所用提示词、模型、画幅和时长 — 让你能复刻一次好的生成,或在差一点时微调重跑。

为音乐视频创作者打造

四种工作流,脚本生成视频工具能省下实打实的制作时间。

歌词视频 B-roll

两分钟内生成与某句歌词情绪匹配的电影感画面。跳过选景、找素材、逐镜渲染 — 输入提示词、预览片段、拖进时间轴。脚本生成视频工具就是为一句话的歌词需要画面、而你又没半天时间去拍的那个时刻准备的。

MV 构思预览

在正式拍摄之前,快速验证你下一支 MV 的视觉创意。从不同提示词生成三四段片段并排对比,决定哪个方向值得真的去订场地。过去要花半天拍摄的完整构思预览,现在一个下午在键盘前就能搞定。

短视频音乐片段

为 TikTok、Reels、YouTube Shorts 生成 8 到 12 秒竖屏预告。用 9:16 生成片段,下载 MP4,直接上传到社交 — 不需要剪辑软件。把片段和一句歌词配在一起,五分钟内就能拿到可发布的预告。

演唱会背景素材

投影级的抽象或叙事画面,适合演出大屏使用。把多段 12 秒片段排队,对齐到歌曲段落,在现场循环播放。输出是干净的 MP4,可以直接丢进 Resolume、OBS 或任何 VJ 软件。

脚本生成视频 vs. 剪映 vs. ChatGPT + Runway

抛开营销话术 — 用专门的脚本生成视频工具相比拼凑通用工具到底有什么不同。

能力手动剪辑(剪映)ChatGPT + Runway本工具
首段片段耗时每镜 30 分钟以上(找素材、剪、调色、导出)跨两个工具 5–10 分钟单次生成 30–90 秒
电影感调校手动调色、变速、转场在另一个聊天窗口里改提示词灯光、镜头运动、调色都在提示词里一次写好
文生视频 + 图生视频只能搜素材,不能生成两个独立工具,提示词历史不共享一个面板内两种模式,上传参考图自动切换
画幅选择每个画幅都要重新剪、重新导出每个画幅都要在 Runway 里重跑每次生成都可选 16:9、9:16、1:1
时长控制从更长素材里剪由 Runway 套餐固定(3s、5s、10s)每段片段可选 5–12 秒
视觉一致性取决于素材匹配度场景之间会漂移,无角色锁定参考图保证多段片段里同一主体
每段成本素材订阅 + 剪辑时间ChatGPT Plus + Runway Standard,按月Veo 8s 片段 28 积分,Seedance 片段 14–42 积分
输出格式剪映导出的 MP4Runway 的 MP4,需单独下载标准 MP4,直接下载,无水印

常见问题

使用脚本生成视频工具前的几个实际问题。

必须先有脚本才能用吗?

不需要。你可以直接在提示词框里输入任意画面描述 — 没有 JSON、没有脚本设置、没有前置步骤。无论你是从已保存的脚本中粘贴一段场景,还是从零开始写提示词,脚本生成视频工具的工作方式都一样。

可以用图片生成视频吗?

可以。上传一张参考图,工具会自动切换到 Seedance Pro Fast,把静态图变成视频片段。这张图会成为片段的首帧,模型在其上生成真实运动。当你已经有角色立绘或上一段片段的一帧时,这就是对的模式。

Veo 3.1 Fast 和 Seedance Pro Fast 有什么区别?

Veo 3.1 Fast 是文生视频模型 — 用语言描述画面,它从零生成电影感片段。Seedance Pro Fast 是图生视频模型 — 需要一张参考图,并在这张图上生成运动。有提示词没图用 Veo。有一帧画面想让它动起来用 Seedance。

生成需要多久?

大多数片段 30 到 90 秒完成,具体看模型和时长。Veo 短片段最快;Seedance 长片段需要完整的 90 秒。结果页有实时状态,你能精确知道什么时候可以预览或下载。

多少钱?

Veo 3.1 Fast 每 8 秒片段 28 积分。Seedance Pro Fast 每片段 14 到 42 积分,视时长而定。每个新账号都有免费积分可以试用,结果页会在生成前显示剩余积分。未用完的积分保留在账号里。

如果生成结果不满意怎么办?

每个任务有一次免费重试机会。如果第二次还是不满意,换一个更精确的提示词或换模型重新生成。微调几个词 — 加「浅景深」、把「大全景」改成「特写」 — 通常第二次或第三次就能命中。

生成的片段可以用于音乐视频吗?

可以。输出是标准 MP4 文件,可直接丢进任何剪辑软件 — DaVinci Resolve、Premiere、剪映、Final Cut。配合我们的合成工具(即将上线)加上音频就能做完整 MV,或者直接把片段发到 TikTok、Reels、Shorts 当预告。

支持哪些画幅?

Veo 3.1 Fast 支持 16:9 横屏和 9:16 竖屏。Seedance Pro Fast 支持 16:9、9:16 和 1:1 方形 — 覆盖横屏 YouTube、竖屏 TikTok 和 Reels 以及方形社交动态。每次生成都可以选画幅,不需要把同一提示词重跑三次。

继续你的工作流

把脚本生成视频工具和这些工具搭配,跑完整支 MV 的制作流程。

准备好生成你的第一段片段了吗?

描述一个画面,选一个模型,两分钟内拿到电影感 MV 片段。

脚本生成视频 | AI 音乐视频片段生成器