AI视频创作从入门到精通教程

返回首页

目录

返回首页
AI视频模型的种类
** 国内模型**
** 可灵**
** 清影**
** Vidu**
** 国外模型**
** Luma**
** Sora**
AI视频生成的不同方式
** 一、文生视频**
** 文生视频的用法**
** 1. 可灵官方提示词公式:**
** 2. 清影官方提示词公式:**
** 3. Vidu官方提示词公式:**
** 4. 站长总结公式:**
** 文生视频示例**
** 简单提示词 VS 中等提示词 VS 复杂提示词**
** 文生视频的注意事项与技巧**
** 1. 尽量使用简单词语和句子结构,避免使用过于复杂的语言;**
** 2. 画面内容尽可能简单,可以在5s或10s内完成;**
** 3. 用东方意境、中国、亚洲等词语更容易生成中国风和中国人;**
** 4. 当前视频大模型对数字还不敏感,比如“10个小狗在海滩上”,数量很难保持一致;**
** 5. 分屏场景,可以使用prompt:“4个机位,春夏秋冬”;**
** 6. 现阶段较难生成复杂的物理运动,比如球类的弹跳、高空抛物等;**
** 二、图生视频**
** 图生视频的用法**
** 图生视频示例**
** 无提示词(效果不好) VS 无主体提示词(效果不好) VS 有主体提示词(效果好)**
** 图生视频的小技巧**
** 图生视频的首尾帧使用方法与参考案例**
AI视频的常见问题
** 1.问:为什么生成的视频没有声音?**
** 2.问:生成的视频如何下载?如何收藏,如何投稿?**
AI视频的高阶提示词词典

欢迎观看《圈友互联AI视频创作从入门到精通教程》!本教程将带您认识各种不同的AI视频模型有什么区别,教您如何系统地构建提示词,从而生成专业级别的视频作品!

AI视频模型的种类

首先,我们先来认识一下AI视频大模型的种类,目前我们网站AI视频板块一共有4种AI模型,其中三个是国产AI模型,一个是国外AI模型,下面是它们的详细介绍:

对于以下不同模型的对比以及案例,可以在【视频广场】中找到,每个视频右下角都会注明视频的来源模型。采用的都是Sora官方提示词来进行对比,以保证公平性,具体详见Sora提示词案例库:Sora AI 提示词全网最全收集——IMYAI.TOP

国内模型

可灵

可灵的视频生成大模型。支持文生视频以及图生视频,生成的视频长达5s和10s,且支持三种宽高比。质量属于国产顶流。

清影

清影(Ying),是智谱AI发布的视频生成大模型,生成速度快,支持参数多,视频时长可长达6s,但视频比例暂时只有3:2,视频总体质量仍有待加强。

Vidu

Vidu,是北京生数科技有限公司联合清华大学发布的视频大模型,视频时长暂时只有3s和7s。相比可灵与清影,画面色彩整体偏暗,质量逊于可灵,优于清影。

国外模型

Luma

Luma,美国3D计算机视觉创企Luma AI发布了一个名为Dream Machine的AI模型。这一模型具备强大的文生视频和图生视频功能,画面极为逼真,人物表情丰富,2分钟内就能完成5秒视频生成。

Sora

美国人工智能研究公司OpenAI开发的一款先进的AI视频生成模型Sora,于2024年2月15日(美国当地时间)推出了一系列Demo视频,由于其高质量、高分辨率的视频内容秒杀全球AI视频同行,而在全球爆火。Sora不仅能生成长达一分钟的视频,而且还被称为“世界模拟器”,因为它能够模拟现实世界的物理规律和复杂场景。一旦正式开放,将成为全球最强的AI视频工具,目前仍在内测中。(估计是由于GPU算力问题,迟迟不能开放)

更多关于Sora的介绍看这篇文章:【科普】史上最强AI文生视频大模型!什么是Sora?一文带你看懂Sora!

更多AI模型介绍:https://models.imyaigc.com/

AI视频生成的不同方式

一、文生视频

文生视频的用法

访问IMYAI,点击进入【视频创作】板块,在左侧栏输入框输入一段文字,选择你喜欢的模型以及比例、时长,点击【立即生成】,AI即可根据你的文本表达生成5s或10s视频,也即是文字转变为视频画面(简称文生视频)。

可灵目前同时支持16:9、9:16与1:1三种画幅比例,而Vidu、Luma只支持16:9,清影只支持3:2。

如果你不知道创作些什么,你可以点击右上角使用系统给出的推荐提示词(都是来源于Sora官方的优秀提示词),或者你随便输入一个单词,比如【熊猫】,AI便会帮你智能优化拓展,这里我的最终结果是【镜头穿越茂密竹林,一只悠闲的熊猫正在啃食翠绿的竹子。】。如果你在下方勾选了【提交后自动优化】,则提交任务之后便会自动帮你优化,无需手点。

AI生成的提示词总是不满意?不想借助AI,想要自己写提示词?如何写好提示词?和AI对话和AI绘画一样,Prompt提示词是作为文生视频大模型最主要的交互语言,将直接决定了模型返回的视频内容,因此,如何使用有效Prompt来完成AI视频创作是值得我们去了解和学习的,目前可灵、Vidu和清影官方都给出了提示词公式,可供参考:

1. 可灵官方提示词公式:

💡****提示词 = 主体(主体描述)+ 运动 + 场景(场景描述)+(镜头语言 + 光影 + 氛围)
括号内内容可选,其实不同官方给出的公式大同小异,我们只需要任选其一即可。

主体: 主体是视频中的主要表现对象,是画面主题的重要体现体。如人、动物、植物、以及物体等;

主体描述: 对主体外貌和动作的具体描述。可通过多个关键词进行补充。如运动表现、发型发色、服饰穿着、五官形态、肢体姿态等;

运动: 对主体运动方式的细节描述,包括动作的目的、流畅性和节奏等;

场景: 场景是主体所处的环境,包括背景、背景物等;

场景描述: 对主体所处场景的细节描述。可通过多个短句进行补充,但不宜过多,符合5s视频内可以展现的画面即可。如室内场景、室外场景、自然场景等;

镜头语言: 是指描述拍摄时的多角度和距离感受。包括拍摄方式与具体的镜头语言。可以描述出所需的视觉效果和情感氛围。如超大远景拍摄、背景虚化、特写、移动追踪、推镜、升镜、航拍等;

光影: 光影是渲染场景作品的灵魂所在。光影的运用可以展现真实感、质感和氛围。可以通过光影的渲染表达力的形成。如氛围光、逆光、顶光、侧光、柔光、阴影等;

氛围: 氛围对视频画面的氛围描述。如热闹的街头氛围、电影院的氛围、温馨的家等。

来源:可灵A!使用指南-视频生成

2. 清影官方提示词公式:

简单公式:[摄像机移动]+[建立场景]+[更多细节]
复杂公式:[镜头语言] + [光影] + [主体 (主体描述)] + [主体运动] +[场景 (场景描述)] +[情绪/氛围/风格]
提示词的精确度与细节水平直接影响视频内容的质量。采用结构化提示词可以极大提升视频内容的符合度和专业性。以下是构建提示词的关键组成部分:

镜头语言:通过镜头的各种应用以及镜头之间的衔接和切换来传达故事或信息,并创造出特定的视觉效果和情感氛围。如镜头平移,推近、拉远、升降拍摄、摇摄、跟随拍摄、手持拍摄、无人机航拍等;

景别角度:控制相机与被摄对象之间距离和角度,实现不同的视觉效果和情感表达。如大全景、中景、近景 、鸟瞰视角 、跟随视角、鱼眼效果等;

光影:光影是赋予摄影作品灵魂的关键元素,光影的运用可以使照片更具深度,更具情感,我们可以通过光影创造出富有层次感和情感表达力的作品。如自然光、丁达尔效应、柔和散射、硬光直射 、逆光剪影、三点布光等;

主体:主体是视频中的主要表现对象。如儿童、狮子、向日葵,汽车、城堡等;

主体描述:对主体外貌细节和肢体姿态等的描述,如人物的服饰、动物的毛色、植物的颜色、物体的状态和建筑的风格;

主体运动:对主体运动状态的描述,包括静止和运动等,运动状态不宜过于复杂,符合6s视频内可以展现的画面即可,

场景: 场景是主体所处的环境,包括前景、背景等;

场景描述:对主体所处环境的细节描述。如都市环境、乡村风光、工业区等;

氛围:对预期视频画面的氛围描述。如喧嚣繁忙、悬疑惊悚、宁静舒适等;

其它技巧:
关键词重复:在提示的不同部分重复或强化关键词有助于提高输出的一致性。如:摄像机以超高速镜头快速飞过森林;
聚焦内容:提示词应集中在视频中应有的内容上。如:冷清的街道,而不是“没有人的街道”;

来源:清影:AI 视频玩转手册

3. Vidu官方提示词公式:

来源:Vidu 提示词指南

4. 站长总结公式:

我个人总结了一下,其实和英语里的5W公式很像,这里我们简化成:3W+1H 公式

【什么人/物(主体)】——【在哪里(地点)】——【干什么(动作)】——【干得怎么样(神态)】
科普:英语里的5W公式指的是新闻写作的“5W+1H”原则,即When(何时)、Where(何处)、Who(何人)、What(何事)、Why(何故)加上How(如何)。这一原则不仅在新闻写作中广泛应用,还被用于各种需要清晰、结构化表达信息的场合。每个“W”和“H”代表一个关键的问题,共同构成了一个完整的信息框架,确保信息的全面性和连贯性。
When 指的是事件发生的时间,这是确定事件背景和情境的重要因素。
Where 描述事件发生的地点,对于地理位置的指定有助于读者形成具体的画面。
Who 涉及事件的参与者,包括主要人物和相关人员。
What 描述事件本身,即发生了什么。
Why 探讨事件的原因或目的,解释事件背后的动机或理由。
How 说明事件是如何发生的,包括方式、方法或手段等。
这一原则不仅在新闻写作中发挥作用,也在广告、市场营销、公共关系等领域中广泛应用,帮助专业人士构建清晰的信息传递路径,确保信息被准确理解和记忆。此外,这一原则还被扩展应用于其他领域,如个人品牌建设、广告策略等,作为一种有效的工具,帮助专业人士更好地规划和执行他们的沟通和传播活动。
同样道理,也非常适用于我们的AI视频创作。

文生视频示例

如“一只大熊猫在咖啡厅里看书”,我们可以增加主体和场景的细节描述“一只大熊猫戴着黑框眼镜在咖啡厅看书,书本放在桌子上,桌子上还有一杯咖啡,冒着热气,旁边是咖啡厅的窗户”,这样AI生成的画面会更具体可控,如果想要增加一些镜头语言和光影氛围,我们可以尝试“镜头中景拍摄,背景虚化,氛围光照,一只大熊猫戴着黑框眼镜在咖啡厅看书,书本放在桌子上,桌子上还有一杯咖啡,冒着热气,旁边是咖啡厅的窗户,电影级调色”,这样AI生成的视频质感会进一步提升,有可能会得到超出预期的结果。

简单提示词 VS 中等提示词 VS 复杂提示词

点击图片可查看完整表格

更多案例可以移步可灵清影Vidu官方文档,或者我们的视频广场查看,这里就不一一展示了。

也欢迎大家多多投稿!!!祝大家玩得开心!!!

文生视频的注意事项与技巧

1. 尽量使用简单词语和句子结构,避免使用过于复杂的语言;

2. 画面内容尽可能简单,可以在5s或10s内完成;

3. 用东方意境、中国、亚洲等词语更容易生成中国风和中国人;

4. 当前视频大模型对数字还不敏感,比如“10个小狗在海滩上”,数量很难保持一致;

5. 分屏场景,可以使用prompt:“4个机位,春夏秋冬”;

6. 现阶段较难生成复杂的物理运动,比如球类的弹跳、高空抛物等;

二、图生视频

图生视频的用法

切换到【图生视频】界面,上传一张图片+相应的提示词,AI大模型将根据提示将图片转变为视频画面。您也可以只上传一张图片,AI大模型将自行发挥想象力,把图片扩展为一段有故事的视频。

图生视频示例

原图:

无提示词(效果不好) VS 无主体提示词(效果不好) VS 有主体提示词(效果好)

点击图片可查看完整表格

更多案例可以移步可灵清影Vidu官方文档,或者我们的视频广场查看,这里就不一一展示了。

也欢迎大家多多投稿!!!祝大家玩得开心!!!

图生视频的小技巧

⚠️****技巧 1: 选用**尽可能清晰**的图片,如果原图不够清晰,会影响模型对图片的识别,可以采用分辨率提升工具将图片变清晰。工具地址:百度AI图片助手 - 图欧学习资源导航 (或者点这里

⚠️****技巧 2:提示词要**【简单清晰】 **

可以选择不写 prompt,直接让AI自己操控图片动起来(AI自由发挥)

明确你想动起来的【主体】并以「主体」+「主题运动」+「背景」+「背景运动」的方式撰写提示词(一定要有主体,不然可能会出现 AI 狂乱景象)

如果你不明确大模型如何理解你的图片,推荐将_照片扔给AI进行识图_,明确你的【主体】该如何描述。

图生视频的首尾帧使用方法与参考案例

什么是视频的首尾帧?视频的首尾帧功能有什么用呢?

一帧,就代表视频的其中一个画面。首帧和尾帧,顾名思义,就是代表视频的第一个画面以及最后一个画面。做AI视频,我们经常会看到AI胡乱发挥,视频的结尾没能很好地达到我们想要的效果。有时候光是提示词还是不够的,我们需要控制AI视频的初始的画面以及结束的画面,这个时候就需要用到首尾帧这个功能了。

科普:视频的帧是指视频中的一幅单独图像,是构成视频的基本单位。在视频播放过程中,这些帧以一定的速率连续显示,从而形成连续的动态画面。每一帧都是一个静态图像,当这些帧快速连续地播放时,人眼会感觉到连续的动作或场景的变化。

**首先,切换成可灵或者Luma模型**,你上传了第一张图片之后,就会出现【结束关键帧图片】的上传按钮,然后就可以上传第二张图片,来定制你的结束画面。

注意:目前只有可灵和Luma支持首尾帧功能。

第一张图片(首帧)

结束关键帧图片(尾帧)

[origin_luma_watermarked_video024e67b104a2346f88204cf85a6d9c359_9f9d9484969ccb68.mp4]

最终成品

没有加提示词,效果居然还挺不错的,如果配上BGM,一个帅气的短视频就可以直接投稿了。当然,首尾帧的用法不局限于此,更多用法欢迎各位自行探索~

AI视频的常见问题

1.问:为什么生成的视频没有声音?

答:截至目前为止,AI生成的视频都是没有声音的,你在网上看到的有声音的AI视频,都是通过剪映或者Pr等剪辑软件后期加上去的。关于声音素材库,我个人比较推荐:音效库 音效素材 声音|影视|游戏|实录 免费下载 - 爱给网

做视频自媒体多年,我个人也整理了一些我常用的音效以及视频素材,欢迎大家抱走:

音效素材库——站长图欧君整理出品
链接:https://pan.quark.cn/s/4ec911b9f2a8#/list/share
10000+款绿幕抠像搞笑转场电影特效等影视后期视频素材,包含各种各样热门冷门类型,可直接导入到剪映、Pr等视频剪辑软件使用!——站长图欧君整理出品
链接1:https://www.alipan.com/s/nV2mgei2a9L
链接2:https://pan.quark.cn/s/394d3194c9de#/list/share

2.问:生成的视频如何下载?如何收藏,如何投稿?

答:点击视频封面进入视频详情页即可下载,支持收藏,支持投稿。优秀作品审核通过后,会上架视频广场。

AI视频的高阶提示词词典

艺术风格小词库
🎨 梵高(Vincent van Gogh)
后印象派风格,以其强烈的色彩和动感的笔触著称。
🌌 马克斯·梅勒(Max Ernst)
超现实主义,使用荒诞、梦幻的元素。
🌀 杜尚(Marcel Duchamp)
达达主义和概念艺术,挑战传统艺术定义。
🎨 杰克逊·波洛克(Jackson Pollock)
抽象表现主义,以其独特的滴画技法闻名。
🌈 雷内·马格里特(René Magritte)
超现实主义,以其神秘和哲学性质的作品著称。
💖 弗里达·卡罗(Frida Kahlo)
表现主义和墨西哥传统艺术风格,作品充满个人情感和象征意义。
🔷 毕加索(Pablo Picasso)
立体主义和多种其他风格,以其解构和重构形状的方式知名。
🌅 莫奈(Claude Monet)
印象派,以其对光线和色彩变化的细腻捕捉著称。
🌩️ 威廉·透纳(J.M.W. Turner)
浪漫主义,以其戏剧化的光影和色彩运用闻名。
😢 爱德华·蒙克(Edvard Munch)
表现主义,以其强烈的情感表达和象征性画面著称。
🔴 草间弥生(Yayoi Kusama)
波普艺术和抽象艺术,以其重复的图案和强烈的色彩对比著称。
🧑‍🎨 安迪·沃霍尔(Andy Warhol)
波普艺术,以其丝网印刷和重复图像的使用知名。
🌌 达利(Salvador Dalí)
超现实主义,以其梦幻般的场景和精细的细节处理著称。
✨ 古斯塔夫·克里姆特(Gustav Klimt)
新艺术运动和象征主义,以其装饰性图案和金色运用闻名。
🎭 布鲁诺·毕加索(Bruno Picasso)
先锋派和实验性艺术,以其创新和跨媒介的作品著称。
镜头语言
1. 镜头平移 (Panning): 摄像机在水平方向上移动,从一个点平稳地移动到另一个点。这种拍摄方式常用于展示一个场景的全貌或跟随一个移动的物体。 🎥

2. 推近 (Pushing In): 摄像机向被拍摄对象靠近,使观众感觉好像自己也在靠近画面中的物体或人物。这种方式可以增加观众的参与感和紧张感。 🔍

3. 拉远 (Pulling Back): 摄像机从被拍摄对象后退,使观众感觉好像自己在远离画面中的物体或人物。这种方式可以展示更大的场景或减少观众的参与感。 🌌

4. 升降拍摄 (Tilting): 摄像机在垂直方向上移动,向上或向下。向上倾斜可以展示从低到高的场景,向下倾斜则相反。 ⬆️⬇️

5. 摇摄 (Swiveling): 摄像机在固定的位置上旋转,改变拍摄的方向。这种方式可以用于展示周围的环境或跟随移动的物体。 🔄

6. 跟随拍摄 (Tracking): 摄像机沿着一个特定的路径移动,通常用于跟随一个移动的物体或人物。 🚶‍♂️

7. 手持拍摄 (Handheld): 摄像机由摄影师手持移动,这种方式可以增加画面的动态感和真实感。 🙌

8. 稳定器拍摄 (Stabilized): 使用稳定器进行拍摄,即使在移动中也能保持画面的稳定。 🏋️‍♂️

9. 无人机航拍 (Aerial): 使用无人机进行高空拍摄,可以展示大范围的地形和场景。 🚁

10. 轨道拍摄 (Dolly Shot): 摄像机安装在轨道上移动,可以平稳地前进或后退,常用于电影中的经典镜头。 🎬
景别角度
1. 大全景 (Wide Shot): 摄像机远离主体,通常用于展示环境或场景的全貌。 🌍

2. 中景 (Medium Shot): 主体占据画面的一部分,适用于展示人物的上半身或场景的一部分。 🧑‍🤝‍🧑

3. 近景 (Close-Up): 主体占据画面的主要部分,适用于展示人物的脸部或物体的细节。 😃

4. 特写 (Extreme Close-Up): 画面中只显示主体的某一小部分,适用于展示细节或情感。 💖

5. 高角度俯拍 (High Angle Shot): 摄像机从高处向下拍摄,使主体显得较小或弱小。 📏

6. 低角度仰拍 (Low Angle Shot): 摄像机从低处向上拍摄,使主体显得强大或威严。 🌟

7. 正面拍摄 (Front Angle Shot): 摄像机正对主体,适用于直接展示人物或物体的正面。 👤

8. 侧面拍摄 (Side Angle Shot): 摄像机从主体的侧面拍摄,适用于展示人物或物体的侧面轮廓。 ➡️

9. 背面拍摄 (Rear Angle Shot): 摄像机从主体的背后拍摄,适用于展示人物或物体的背面。 🔙

10. 鸟瞰视角 (Bird’s Eye View): 摄像机从极高的角度拍摄,类似于鸟儿在空中俯瞰的视角。 🐦

11. 虫视角 (Worm’s Eye View): 摄像机从极低的角度拍摄,类似于虫子在地面上仰望的视角。 🐛

12. 跟随视角 (Tracking Shot): 摄像机跟随移动的主体,适用于展示主体的动态。 🏃‍♂️

13. 倾斜角度 (Dutch Angle): 摄像机倾斜拍摄,使画面产生不平衡或紧张感。 ⚖️

14. 对称构图 (Symmetrical Composition): 画面中的元素以中心轴线对称排列,适用于创造平衡和和谐感。 ⚪

15. 框架构图 (Frame Within a Frame): 画面中有一个或多个框架元素,如门窗,用于突出主体。 🖼️

16. 深度构图 (Deep Focus): 画面中的前后景都保持清晰,适用于展示丰富的场景层次。 📸

17. 长焦肖像 (Telephoto Portrait): 使用长焦镜头拍摄人物肖像,使主体在画面中显得更加突出。 🎭

18. 宽角建筑 (Wide-Angle Architecture): 使用宽角镜头拍摄建筑物,展示其宏伟或独特的结构。 🏛️

19. 鱼眼效果 (Fisheye Lens Effect): 使用鱼眼镜头拍摄,产生一种极端的宽角效果,使画面边缘产生畸变。 🐠
光影效果
1. 自然光 (Natural Light): 来源于太阳或月亮的光线,通常给人一种自然和真实的感觉。 ☀️🌙

2. 丁达尔效应 (Tyndall Effect): 通过散射粒子使光线可见,常用于营造神秘感。 💫

3. 柔和散射 (Soft Light): 经过散射的光线,如阴天时的光线,产生柔和的阴影和较少的对比。 ☁️

4. 硬光直射 (Hard Light): 直接来自光源的光线,如晴朗天气下的阳光,产生清晰的阴影和强烈的对比。 🔆

5. 逆光剪影 (Backlighting): 光源位于主体的背后,使主体产生剪影效果,强调轮廓和形状。 🌄

6. 侧逆光 (Side Light): 光源从主体的侧面照射,强调纹理和形状,产生戏剧性的阴影效果。 🎭

7. 伦勃朗光 (Rembrandt Lighting): 类似于伦勃朗画作中的光影效果,通常在主体的脸颊上产生一个三角形的光亮区域。 🎨

8. 三点布光 (Three-Point Lighting): 使用三个光源:主光、辅助光和背光,分别照亮主体的正面、减少阴影和强调轮廓。 💡

9. 聚光灯 (Spotlight): 集中的光线,用于突出特定区域或主体,产生戏剧性的效果。 🎇

10. 泛光灯 (Floodlight): 广泛分布的光线,用于照亮较大的区域,通常产生均匀的光照效果。 💡

11. LED灯 (LED Lighting): 使用LED光源,具有高能效和长寿命的特点,适用于各种照明需求。 🔋

12. 色温调节 (Color Temperature Adjustment): 调整光源的色温,使其更暖或更冷,影响画面的氛围和感觉。 🌈

13. 光影交错 (Interplay of Light and Shadow): 光线和阴影的相互作用,用于创造深度和戏剧性。 🌌

14. 阳光透过 (Sunlight Filtering): 阳光透过物体,如树叶或窗户,产生斑驳的光影效果。 🌿

15. 霓虹灯光 (Neon Lighting): 使用霓虹灯作为光源,通常产生鲜艳和未来感的效果。 🌈

16. 舞台灯光 (Theatrical Lighting): 类似于舞台表演使用的灯光,用于创造戏剧性和强调特定区域。 🎭

AI视频创作从入门到精通教程
http://example.com/2024/11/13/AI资讯互联/AI视频创作从入门到精通教程/
作者
技术Z先生
发布于
2024年11月13日
许可协议