【干货】有关压制视频编码,转码的一些参数设置说明

温馨提示:本文最后更新于2024-01-08 10:07:19,某些文章具有时效性,若有错误或已失效,请在下方留言或联系站长

软件工具程序应用:

推荐的工具有ShanaEncoder,Handbrake(大菠萝),TMPGEnc Video Mastering Works小日本视频转换器。

另外大家也可以用Adobe Media Encoder,小丸子工具箱,格式工厂,MeGUI,影音转码快车MediaCoder,FFmpeg等其它应用。

总之就是大家习惯擅长哪个就用那个,不过建议使用功能较全的,这里就拿ShanaEncoder来说明。

ShanaEncoder编码工具界面

d2b5ca33bd20240108094619

 

MeGUI界面

d2b5ca33bd20240108094650

Handbrake(大菠萝)界面

d2b5ca33bd20240108094711

视频编码Video Encoding:

定义:指通过压缩技术,将原始视频格式的文件转换成另一种视频格式文件的方式。视频流传输中最为重要的编解码标准有国际电联的H.261、H.263、H.264(AVC),H.265(HEVC),运动静止图像专家组的M-JPEG和国际标准化组织运动图像专家组的MPEG系列标准,此外在互联网上被广泛应用的还有Real-Networks的RealVideo、微软公司的WMV以及Apple公司的QuickTime等(引用于百度百科)。

编码格式通常有H.261Mpeg1(vcd),H.262(MPEG-2第2部分DVD)、MPEG-4第2部分(DVDRIP使用的都是它的变种,如:divx,xvid等)、H.264(MPEG-4第10部分)、HEVC(H.265)、Theora、RealVideo RV40、VP9和AV1H.262(MPEG-2第2部分)、MPEG-4第2部分、H.264(MPEG-4第10部分)、HEVC(H.265)、Theora、RealVideo RV40、VP9和AV1等。

X264和H264本质上是对同一个视频格式的两种(民间)称呼,就像我们可以既可以把PC叫做电脑,也可以把它叫做计算机一样。但不同的是,x264是H.264/AVC的一个编码器,而H.264是一个视频格式标准,但为了方便,大部分时候都直接用编码器名称标注格式,如现在我们所说的x265其实是指H.265/HEVC标准,以前的 DivX/Xvid表示MPEG-4 Part 2标准一样。当然可用于H.264/AVC的编码器不止x264,但x264绝对是最普及的那个。

编码格式大家不用在乎别的,一般选用AVC或HEVC即可,至于AMF,NVENC,QSV这些无非就是硬件加速,提升编码效率的,一般不建议使用,因为影响编码质量。

AMF是A卡加速(功能用不了更新显卡驱动)NVENC是N卡加速(功能用不了更新显卡驱动)QSV是Intel英特尔提供的加速功能,要CPU支持就能用,这个功能比另外两个都要慢!比上面的都精细,但还是不如普通模式,要是大家对视频质量要求不高可以用,不过尽量用动态模式,但是A,N卡加速压过的视频时长有所变化,有时音画不同步,丢帧的情况,相比之下QSV模式相对好点,不过这些模式电脑配置底就别用了,好处就是提升编码速度,具体用不用视情况而定。

至于H264和H265具体要用哪个还要视情况而定,比方说你要上传视频到某网站,要是该站不支持HEVC就用AVC,或者你的媒介不支持播放HEVC或10bit,12bit,High10,high422,high444就不要用这些了。

复制流就是复制原视频参数,虽然参数和原视频一样,但是视频不同于音乐经过二压3压后画质只会越来越差。此项一般用于音视频混流或合并被拆分的原视频。

2pass,3pass就是2次编码和3次编码,耗时且效果不是很显著所以一般没必要用

下面这3项影响编码质量,所以不建议勾选。要是图速度不重视质量就根据自身情况选择吧!

快速编码:一般不建议勾选

零延迟:降低在线转码的编码延迟。 一般不建议勾选

OpenCL加速:也就是GPU加速。 一般不建议勾选

编码设置界面

d2b5ca33bd20240108094833

分辨率Image resolution:

又称解析度、解像度、解像力,可以细分为显示分辨率、图像分辨率、打印分辨率和扫描分辨率等。

分辨率就是提供视频画面大小的框架尺寸,跟视频画质并无直接关系,只是更大的分辨率可以容纳更多的码流,视频是否清晰还要看分辨率和比特率设置的是否恰当。

屏幕分辨率Screen resolution是指纵横向上的像素点数,单位是px。屏幕分辨率确定计算机屏幕上显示多少信息的设置,以水平和垂直像素来衡量。

视频分辨率比例大致分为横(宽)屏,方屏(1:1一般不常用),竖(纵)频(多用于短,小视频平台)

横(宽)屏比例有:16:9,4:3,3:2,16:10,5:4,现在最常用的基本都是16:9,16:9和4:3不是一回事,大家不要亦数学换算的方式来看待,另外不同比例的分辨率对应的码率和帧率也有所不同。

竖(纵)频(多用于短,小视频平台)比例有:9:16,3:4,2:3,10:16,4:5,正好和宽屏相反,最常用的基本都是9:16,多用于手机平台。

常用横(宽)屏分辨率有480p(854×480),540p(960×540),720p(1280×720),1080p(1920×1080),2K(2560×1440),4k(4096×2160)纵屏与之相反,

这里说一下1080i与1080p区别:

1、扫描方式不同

通俗的说,1080P和1080i的分辨率都是1920X1080。但P代表逐行扫描,i代表隔行扫描。理论上逐行扫描比隔行扫描清楚,但肉眼分辨需要根据屏幕的大小判断。

2、应用领域不同

1080i适于表现纪录片和野生动物等题材,但不是那么适合播放运动和电影类的内容。1080p被称为目前数字电视的顶级显示格式,这种格式的电视在逐行扫描下能够达到1920×1080的分辨率。受限制于存储介质(一部1080p的影片需要10GB以上的存储空间),目前1080p的影片多数以蓝光方式发行。

3、高清程度不同

1080p和1080i的区别就在于1080p不是隔行扫描的。每一线都同时表现在画面上,因此比隔行扫描电视更加的平滑,这是最高的高清标准。所以现在网络是基本都使用逐行扫描模式。

比特率Bit rate:

通常也叫码率是指单位时间内传送的比特(bit)数,单位为bps(bit per second)

在近代数字通信中,数字化的视频等信息传输量较大,因此往往以每秒千比特或每秒兆比特为单位于以计量,分别写作kbit/sec(或kbps)和Mbit/sec(或Mbps)。例如一个普通彩色电视信号数字化后的信息量可达216Mbit/sec。一个好的数字传输信道可传几十路彩色电视节目,它的容量每秒可达到若干吉比特或千兆比特(写作Gbit/sec或Gbps)

视频比特率Video bit rate是指每秒传送的比特(bit)数。单位为bps(Bit Per Second),比特率越高,每秒传送数据就越多,画质就越清晰。视频中的比特率是指将光信号转换成数字图像信号后,单位时间内的二进制数据量,是间接衡量视频质量的一个指标。 视频中的比特率(码率)原理与通信中的相同,都是指由模拟信号转换为数字信号后,单位时间内的二进制数据量。

视频比特率的几种编码形式:

VBR(Variable Bitrate)动态比特率 也就是没有固定的比特率,压缩软件在压缩时根据视频数据即时确定使用什么比特率,这是以质量为前提兼顾文件大小的方式,这种方式在根据视频复杂,光暗,画面变化多的地方设置较高的码率,在画面单一,明亮,相对静止的地方设较低的比特率来合理分配码率达到极佳的编码质量,类似动态帧数也是如此,所以推荐此编码模式。不过该模式编码的视频体积往往也比固定和平均模式大一点,不过差距不是很大,所以没必要太过纠结。

ABR(AVerage Bitrate)平均比特率是VBR的一种插值参数。LAME针对CBR不佳的文件体积比和VBR生成文件大小不定的特点独创了这种编码模式。ABR在指定的文件大小内,以每50帧(30帧约1秒)为一段,可以做为VBR和CBR的一种折衷选择。

CBR(Constant Bitrate)常数比特指文件从头到尾都是一种位速率。相对于VBR和ABR来讲,它压缩出来的文件体积很大,而且画质相对于VBR和ABR不会有明显的提高

MBR编码

MBR 编码的设计目的是适应带宽的波动。MBR编码在单个编码文件中结合了数个比特率。或者,您也可以选择针对每个比特率创建不同的文件。对文件进行访问时,服务器可根据可用带宽来确定适当的比特率,然后按照最理想的比特率来处理编码的文件。如果可用带宽由于任何原因而降低,则可以采用更低的比特率来处理流。采用的比特率越低,质量也就越差。

影响视频画质清晰度的根本因素就是码率,一般越清晰的视频往往比特率很高也称为高码版视频,像蓝光或4K,8K类视频,标准码率在几十万kb/s,十几万kb/s左右。不过这只是一方面,视频的清晰度往往由多个因素造成,例如场景复杂度,画面变化速率,光暗,虚实动静,视频类型等多个方面。

BD和HD、DVD

BD是Blue Disk的简称,翻译成中文是“蓝光影碟”的意思。BD就是从蓝光影碟转录的视频和音频,画面清晰度很高。通常一部电影在公映结束之后,后续会推出周边产品,其中最主要的就是影片DVD,而BD蓝光影碟就是影片DVD的承载格式。网络上的BD往往只是网站自身标准,大多远未达到真正的BD标准,不过这都是有很多原因的。

HD是High Definition的简称,翻译成中文是“高分辨率”的意思。HD分有HD RIP(HDTVRip高清电视资源压缩的缩写)和HDVD(压缩碟或者经济版DVD)两个主要类别,HDVD俗称压缩碟或者经济版DVD,而HD RIP适合添加外挂字幕。一些高码视频标准,一般屏幕不是很大,此模式往往观感已经可以了。

DVD版:全称是“Digital Video Disc”(数 字视频光盘),后来则被称为“Digital Versatile Disc”, 即“数字通用光盘”,是LD/CD/VCD等光存储产品的接班人。与VCD不同的是它的图像清晰度可达720线。DVD,普通家用DVD的格式,480P,即720×480 或720×576。早期使用较多,比如EVD等一些设备,现在基本淡出大众视线。

几者区别:

一、分辨率不一样:BD蓝光电影分辨率为1920X1080或者更高,而HD高清电影的分辨率不为固定,分辨率等级较多,不过普遍比BD蓝光电影的分辨率要低。

二、占全容量不一样:由于BD蓝光电影的分辨率和码率较高,因此有时一般影片的体积达到40-70G左右。而HD高清电影为了方便存储和传输,因此具有多种压缩格式,HD高清电影介质通常为DVD-5(容量4.7G)也有DVD-9的(容量8.5G)。

很明显画质依次是BD>HD>DVD,也可以简单理解为超清,高清,标清。一般各网站的画质并不是标准的参数,为了能少占用服务器内存和容量,再为了更快的播放不同网站都有各自的画质标准,毕竟网站都是在线播放,过高的码率需要更好的网络,不然播放就会卡顿延迟高等,而且更费流量,所以没必要。

帧,帧数,帧率,和fps区别:

1、帧 Frame

简单的理解帧就是为视频或者动画中的每一张画面,而视频和动画特效就是由无数张画面组合而成,每一张画面都是一帧。

2、帧数(Frames)

为帧生成数量的简称。由于口语习惯上的原因,我们通常将帧数与帧率混淆。每一帧都是静止的图象,快速连续地显示帧便形成了运动的假象,因此高的帧率可以得到更流畅、更逼真的动画。往往动画类视频相比拍摄类视频需要更高的帧数。

3、帧数与帧率的区别

根据公式,速率(Speed)=距离(Distance)/时间(Time),单位为米每秒(m/s, meterspersecond, mps);同理,帧率(Frame rate)=帧数(Frames)/时间(Time),单位为帧每秒(f/s, frames per second, fps)。

也就是说,如果一个动画的帧率恒定为60帧每秒(fps),那么它在一秒钟内的帧数为60帧,两秒钟内的帧数为120帧。

帧率是用于测量显示帧数的量度,测量单位为“每秒显示帧数”( Frame per Second, FPS)或“赫兹”( Hz),一般来说 FPS 用于描述视频、电子绘图或游戏每秒播放多少幀

4、FPS( Frame per Second)每秒显示帧数

FPS:是图像领域中的定义,是指画面每秒传输帧数,通俗来讲就是指动画或视频的画面数。 FPS是测量用于保存、显示动态视频的信息数量。每秒钟帧数愈多,所显示的动作就会愈流畅。通常,要避免动作不流畅的最低是23 。某些计算机视频格式,每秒只能提供15帧。

FPS:也可以理解为我们常说的“刷新频率”或者“刷新率”,使用“赫兹”( Hz)为单位。最简单的就是我们玩儿LOL英雄联盟、 CS 、以及手机上的王者荣耀等游戏中说的“ FPS 值”。而在显示器的刷新率中,如果你使用过那种很笨重的CRT显示器,那么你一定经历过将刷新率调低后,看着整个画面都是在闪烁的,所以当时的显示器的刷新率最大也就只有60Hz,而现在子凡随便一看都是150Hz了,但是也会更具显卡来设置,当然60Hz也够了。其中说的60Hz的刷新率,也就是指屏幕一秒内只扫描60次,即60 帧/秒。

动画类(游戏,动漫)视频不同于拍摄类视频,往往需要更高的帧数,不然就显得不连贯,由于这类视频是通过一些软件工序渲染制作而成,所以在录制和压缩游戏视频时要是条件允许帧数最好不要低于50FPS,码率和分辨率也不要太低。

拍摄类视频帧数一般不低于23FPS往往都无明显差别,这类视频还受到拍摄设备,像素,光线,明暗,动静,虚实等多方面因素影响,比如说专业高清相机拍摄的画面一般比普通手机拍摄的要好很多,还有明亮的静态画面看起来要比昏暗复杂的动态高码画面清晰一样是不定的。

一般720p(DVD)4:3,也就是960×720下Bit值:1000~3000Kbps左右,帧数:13.965~30fps左右。在16:9(1280×720)Bit值:1500~8000Kbps左右,帧数:23.976~60fps左右。竖屏视频码率和帧数可根据宽屏适当低一些。

画质级别:

baseline”, “main”, “high”, “high10”, “high422”, “high444

1、Baseline Profile:基本画质。支持I/P 帧,只支持无交错(Progressive)和CAVLC;

2、Extended profile:进阶画质。支持I/P/B/SP/SI 帧,只支持无交错(Progressive)和CAVLC;(用的少)

3、Main profile:主流画质。提供I/P/B 帧,支持无交错(Progressive)和交错(Interlaced), 也支持CAVLC和CABAC的支持;

4、High profile:高级画质。在main Profile 的基础上增加了8×8内部预测、自定义量化、 无损视频编码和更多的YUV 格式;现在的主流选择。此算法后面有衍生出了high(8bit)”, “high10(10bit),12bit,往上画面越精细,不过需要播放设备支持。

H.264 Baseline profile、Extended profile和Main profile都是针对8位样本数据、4:2:0格式(YUV)的视频序列。在相同配置情况下,High profile(HP)可以比Main profile(MP)降低10%的码率。 根据应用领域的不同,Baseline profile多应用于实时通信领域,Main profile多应用于流媒体领域,High profile则多应用于广电和存储领域

动画类(动漫,游戏)视频方面建议用high422″, “high444模式,animation调整,常规视频编码采用high(8bit)”, “high10(10bit)就行,要求不高high一般就行了,8bit,10bit等指的是色深,是一个像素的某一颜色用多少bit来存储。一般情况下8bit,10bit视觉上差别不大,但10bit同质量下压缩率高些。high10这里还需要你自身播放器支持,不然视频打不开,12bit就是更进一步,baseline”, “main现在一般不怎么用了,就不详说了。

这里说一下Main 10 profile就是Main profile(8bit)升级版,如同high(8bit)”, “high10(10bit)一样。条件允许可以勾选此项。

在HEVC中支持三个档次(profile),分别是主档次main profile(CTB的大小从16 * 16到64 * 64,解码图像的缓存容量限制为6幅图像,允许选择波前和片划分方式,但是不能同时选择)、10bit主档次(main 10 profile)、静止图像主档次(main still profile不支持帧间预测编码,视频的全部的码流只能一帧编码),外层档次可以兼容内层的等级。

画质级别

d2b5ca33bd20240108095118

AVC级别默认选择AUTO无限制/自动推测就可以了

tune是编码质量和画面细节相关的参数。

film”电影, 

“animation”动画, 

“grain”颗粒,噪点 

“stillimage”静态图像, 

“psnr”PSNR测试,

 “ssim”SSIM测试, 

“fastdecode”快速解码,

 “zerolatency”零延迟这几种。

视情况而选,一般不用。

tune编码类型

d2b5ca33bd20240108095138

编码速度:

“ultrafast”,

“superfast”,

“veryfast”, 

“faster”, 

“fast”, 

“medium”, 

“slow”,

“slower”,

“veryslow”, 

“placebo”,

从上往下依次由最快到最慢。无特殊要求选medium即可。

d2b5ca33bd20240108095203

码率控制(编码方式)

几种方式:CQP(恒定质量)量化、CRF(恒定码率)质量、ABQ(平均码率),VBR(动态码率)。缺省方法是CRF,优先级是VBR > ABR > CQP > CRF。

bitrate和QP都没有缺省值,一旦设置他们就表示要按照相应的码率控制方法进行编码,CRF有缺省值23,没有任何关于编码控制的设置时就按照CRF缺省值23来编码。

使用建议:    

CQP一般不推荐使用,在一些算法验证工作中会使用这种模式,可用的值从1到81,一般使用23到36,数值越大画面质量越差。

CRF适合在关注一遍编码质量而输出文件大小或码率不是太紧要的场景下使用,一般网络压片使用CRF。可用的值从1到51,越小编码质量越好,同样码率也越高。一般使用16到24,可以为浮点。(crf并不是恒定质量的方式,同一片子同一crf值,其他参数不同可能码率和质量差较大,不同的片子之间就更没有可比性了)

此模式把某个“质量”作为编码目标,根据片子质量自动分配码率的vbr(Variable Bit Rate动态比特率)。X264中构想是让crf n提供与qp n相当的视觉品质,但编码文件更小一些。

CRF是借由降低“较不重要”帧的品质来达到此目的。在此情况下,“较不重要”是指在复杂或高动态场景的帧,其品质不是很耗费位元数就是不易察觉,所以会提高它们的量化值。从这些帧里所节省下来的位元数被重新分配到可以更有效利用的帧。当crf为0时,与qp 0相同,实现无损编码。     

1 pass ABR – 适用于流媒体或者目标码率受限的实时应用场景。    

2 pass VBR – 适用于有目标码率限制而又有时间可以进行二次编码的非实时应用。

ABR恒定平均目标码率。想要选择这种码率控制方法,必须先设置bitrate。X264中bitrate的单位是Kbps(K bit per second).

编码模式1

d2b5ca33bd20240108095225

编码模式2

d2b5ca33bd20240108095235
不管用什么模式,首先要看原素材的参数信息,这里推荐用该软件MediaInfo_GUI先查看清楚原视频详细参数信息,再根据情况编码,建议用自定义码率模式。质量CRF模式的话要是编码软件支持预测输出文件大小也可使用。

MediaInfo_GUI参数界面1

d2b5ca33bd20240108095330

MediaInfo_GUI参数界面2

d2b5ca33bd20240108095345

容器(封装格式)

大家千万不要与编码格式混迹,编码格式是一种算法,影响视频结构和画质及大小,而封装格式算是一种后缀名,相当于不同形状的容器,并不影响大小,但是不同的容器对编解码器有限制条件,目前来说MKV是支持编解码器最多的封装格式。

常用的视频封装格式MP4,MKV,MOV,RMVB,AVI,FLV,WMV,M4V,其中RMVB是RM的升级格式,不过由于不是开源的所以现在好多转码软件无权用,推荐大家使用MKV和MP4就可以了。

常用的音频封装格式MP3,M4A(AAC),AC3,OGG,无损格式有APE,FLAC,WAV,视频编码一般采用AAC或AC3格式。

容器格式

d2b5ca33bd20240108095435

AVC更多参数说明:

Deblocking去块滤波,一般用于低码视频,此项一般不用,所以大家不必太过纠结,这个主要影响画质,具体情况还需大家自行尝试。

Deblocking Alpha去块强度(Alpha Deblocking)数值由-6~6,缺省值为0一般就可以(特别是cqm),它会去方块但画面变模糊,该值是决定画面是否锐化的最重要的参数,值越大,去方块越明显,反之,锐化越明显。

Deblocking beta去块阔值(beta Deblocking) 值越低,被去块化(deblock)的方块越少。增加beta值,环状物(ringing)就越少,而降低beta则DCT块越少(矛盾)。

如果你不需要编码很细,不介意偶尔的块,可以用-2:-1;如果你喜好更明亮的画面,且不介意一点点模糊,那就用1:2;动画则用低beta值;推荐用缺省值

CABAC建议勾选,不然影响编码质量

弹性内容的二进位算数编码(CABAC:Context Adaptive Binary Arithmetic Coder)资料流压缩,切换回效率较低的弹性内容的可变长度编码(CAVLC:Context Adaptive Variable Length Coder)系统。大幅降低压缩效率(通常10~20%)和解码的硬体需求,要是条件允许并支持CAVLC就尽量选择这个。

GOP Size连续的画面组大小

GOP(Group of Pictures)策略影响编码质量:所谓GOP,意思是画面组,一个GOP就是一组连续的画面。MPEG编码将画面(即帧)分为I、P、B三种,I是内部编码帧,P是前向预测帧,B是双向内插帧。简单地讲,I帧是一个完整的画面,而P帧和B帧记录的是相对于I帧的变化。没有I帧,P帧和B帧就无法解码,这就是MPEG格式难以精确剪辑的原因,也是我们之所以要微调头和尾的原因。

Maximum GOP size:250一般压制动画类视频可适当增大

Minimum GOP size:25一般压制动画类视频可适当减小

不过GOP一般不用,要是用的话就禁用关键帧

Open GOP

技术能提升编码效率。但一些解码器对open-GOP的视频流支持不完全,所以至今依然默认为关闭。建议不勾选

MPEG的格式支持open GOP或者close GOP格式。Close GOP是指帧间的预测都是在GOP中进行的。而使用open GOP,后一个GOP会参考前一个GOP的信息。使用这种方式就大大降低了码率。

Slice切片

设定每帧的切片数,而且强制为矩形切片(会被–slice-max-size或–slice-max-mbs覆写)。一般不设置此项,默认就行。如果是在为蓝光编码,将值设为4。否则,不要使用此选项,除非你知道真的有必要。

Number of slices per frame每帧切片数:0

Slice max in bytes:0  

slice max in macroblocks:0

B-frames可插入B帧数量:默认3,范围是从0到16,根据具体情况调整,一般不用改动

B-frame Bias(B帧偏好设定): 默认0,控制插入B帧判定,范围-100~+100,越高越容易插入 B 帧,一般不用改动

Adaptive B-frames:

OFF FAST Optimal自适应B帧判定模式:有三种,一般选Fast就可以,追求质量就选Optimal,不过影响编码效率

B-frame Pyramid(B帧作参考帧):预设值normal标准,允许B帧作为其他帧的参照帧。没有此设定时,帧只能参照I/P帧。虽然I/P帧因其较高的品质作为参照帧更有价值,但B帧也是很有用的。作为参照帧的B帧会得到一个介于P帧和普通B帧之间的量化值。b-pyramid需要至少两个以上的–bframes才会运作。如果是在为蓝光编码,须使用none禁用或strict始终。

B-frame Weighted Prediction(B帧加权预测)一般开启。Number of B-frames:最大允许连续B帧数量。对于动漫可以选择5-7。越舒缓的动漫值越大。不建议超过10。越大的数值一般使得文件大小越小。

P-frame Weighted Prediction(P帧加权预测)建议选2-weighted refs + Duplicates

Reference Frames最大参考帧:范围是从0到16,一般建议选2~6,视原素材情况而定。

Adaptive I-Frames Decision自适应I帧决策,建议勾选

Extra I-frames插入I帧最低值 预设值:40,不太明白一般默认就行

Interlaced mode(隔行扫描模式)交错编码,无详细说明,缺省none即可

Pulldown:无详细说明,缺省none即可

下面这两项一般不勾选

Use Periodic Intra Refresh使用定期的内部刷新

Enable constrained intra prediction启用限制的内部预测,这是SVC编码的基础层(base layer)所需要的。既然EveryoneTM忽略SVC,你同样可以忽略此选项。

帧数详细参数

d2b5ca33bd20240108095515

Quantizers量化器(此项搞不懂就别乱设)

最小/最大/相邻帧量:0,81,4

量化比(I:P/P:B):1.4,1.30

Chroma and Luma QP Offset(色度与亮度量化差) 色度和亮度QP偏移,此项默认0即可

片尾量化值:默认40进行

Rate Control:

VBV Buffer Size ( Kbps )缓冲区大小:0 视情况而定

VBV Maximum Bitrate 最大比特率瞬时码率(峰值码率 Kbps ):0 视情况而定

VBV Initial Buffer(缓冲区最大保留数据)初始缓冲区 :0.9 一般默认即可

AVerage Bitrate Variance比特率方差:1.0 一般默认即可

Quantizer Compression量化压缩:0.60 一般默认即可

Temp . Blur of est . Frame complexity相邻帧平滑量化值的比例:20.0 一般默认即可 

Temp . Blur of Quant after CC 统计文件结果平滑量化值比例:0.5 一般默认即可

Number of Frames for Lookahead:60 一般默认即可

Mb-tree(使用mb-tree控制方法)默认勾选

VBV会降低品质,所以必要时才使用,动态编码需要使用此项,具体要怎么设置还需看原视频。

比如说原视频码率6000,那么在压制是VBV Maximum Bitrate 这个最大值不要超过6000,VBV Buffer Size这个可以适当增大(比如9000)一般此值不建议小于峰值码率,增大该项会影响视频大小和画质。

Adaptive Quantizers(AQ) 自适应量化器

mode:

预设值:1 – Variance AQ

弹性量化模式。没有AQ时,x264很容易分配不足的位元数到细节较少的部分。AQ是用来更好地分配视讯里所有巨集区块之间的可用位元数。此设定变更AQ会重新分配位元数到什么范围里:

Aq模式,分别为:

0-Disabled:不用AQ。不建议

1 – Variance AQ:允许AQ重新分配位元数到整个视讯和帧内。用的较多

2- Auto-Variance AQ:自动变化(Auto-variance)AQ,会尝试对每帧调整强度。(实验性的)

3- Auto-variance AQ with bias to dark scenes(偏暗场)

实际aq的应用不仅与aq-mode的设置有关,还与aq-strength有关,aq-strength决定是了实施aq-mode的强度,aq-strength的取值范围在(0,3),

值越大应用aq的强度越大;与aq相关的主要函数为x264_adaptive_quant_frame,在该函数中,根据不同的aq模式完成每个宏块的qp偏移值,计算过程使用到宏块的方差信息与aq-strength

Strength强度

预设值:1.0 一般默认即可

弹性量化强度。设定AQ偏向低细节(平面)的巨集区块之强度。不允许为负数。0.0~2.0以外的值不建议。

量化器和比特率详细参数

d2b5ca33bd20240108095547

Motion Estimation动态预测

Chroma ME色度动作估测

M.E. Range半径范围:默认16,最大64,设置的值越大编码质量越高,不过编码速度会大幅度下降,一般保持默认或别大过36,根据变形系数对应设置,太高没必要画质差别不明显,而且还拖慢速度。

M.E. Method变形系数算法:默认hex,一般设置umh或默认就行,同样太高没必要画质差别不明显,而且还拖慢速度。

dia(菱形搜索)

hex(正六边形所搜)

umh(非对称十字可变半径六边形网络搜索)

esa(全搜索)

Tesa(全面详细搜索法)这个算法和ESA相比主要是在搜索范围上的变化

 

Subpixel M.E.动态预测及分区方式:预设值:7

可用的值:

0:Fullpel only

1:QPel SAD 1 iteration

2:QPel SATD 2 iterations

3:HPel on MB then QPel

4:Always QPel

5:Multi QPel + bi-directional motion estimation

6:RD on I/P frames

7:RD on all frames

8:RD refinement on I/P frames

9:RD refinement on all frames

10:QP-RD (requires –trellis=2, –aq-mode>0)

11:Full-RD (requires –trellis=2, –aq-mode>0)

定子像素(subpixel)估算复杂度。值越高越好。层级1~5只是控制子像素细分(refinement)强度。层级6为模式决策启用RDO,而层级8为动态向量和内部预测模式启用RDO。RDO层级明显慢于先前的层级。

使用小于2的值不但会启用较快且品质较低的lookahead模式,而且导致较差的–scenecut决策,因此不建议。

 

MV prediction mode中压预测模式:分别四种none无/spatial空间/temporal临时/auto自动,一般选auto就行

trellis高级

预设值:

1-Final MB宏块最终编码时使用,0是关闭,2是一直使用,建议预设值:1即可

执行Trellis quantization来提高效率。

0-None:停用。

1-Final MB:只在一个巨集区块的最终编码上启用。

2-Always:在所有模式决策上启用。

在巨集区块时提供了速度和效率之间的良好平衡。在所有决策时则更加降低速度。

PSY-RD量化:

(requires Subpixel M E>=6):1.00 默认

Psy-trellis: 0 默认

(requires Trellis) 

下面这些一般不勾选

No Psychovisual Enhancements关闭心理视觉增强 一般不勾选

No Dct Decimate关闭P帧联合编码(增加细节,但会增大体积) 一般不勾选

No Fast P-Skip 关闭快速P帧跳过检测 一般不勾选

No Mixed Reference Frames关闭在一帧内使用不同参考帧(勾选此项会影响画面质量,但能提升编码速度)建议不勾选

Fake Interlaced反交错,根据视频情况勾选

 

Macroblocks宏块,分为All所有,none无,custom自定义,default默认,此项一般情况选择默认或All就行

Noise Reduction降噪,去噪点,值范围0~10000,视情况而设置

Deadzones预设值:21/11,一般不作设置,默认就行

设定inter/intra亮度量化反应区(deadzone)的大小。反应区的范围应该在0~32。此值设定x264会任意舍弃而不尝试保留细微细节的层级。非常细微的细节既难以看见又耗费位元数,舍弃这些细节可以不用浪费位元数在视讯的此类低收益画面上。反应区与–trellis不相容。

Quantizer Matrices量化器矩阵,内建预设有flat和jvt,此项默认就行

其它算法及矩阵参数

d2b5ca33bd20240108095611

Video Usability Info(简称V.U.I)

Crop overscan:undef未定义

Video format视频格式: undef

Color primaries基调色: undef

Transfer转场颜色:undef

Color matrix颜色矩阵:undef

HRD Info信息:none 蓝光选项可根据情况变更

Chroma location 色度位置

其中基调色,转场颜色,颜色矩阵可根据原视频素材情况而设置,一般默认即可

Force pic struct in Picture Timing SEL(Pic-struct)强制为Pic结构,此项一般不选

 

下面这些一般情况不用管

Enable compatibility hacks for Blu-raysupport(bluray-compat)启用蓝光支持的兼容性黑客(模糊兼容)视情况而定

Enable PSNR computation(psnr)启用 PSNR 计算(psnr)

Enable SSIM computation(ssim)启用 SSIM 计算

Low-latency but lower-efficiency threading(sliced-threads)低延迟但效率较低的螺纹(切片线程)

Slightly improve quality of SMP, at the cost of repeatability(non-deterministic)以可重复性为代价略微提高 SMP 质量(非决定性)

Use access unit delimiters(aud)使用访问单元划界器(aud)

Force constant framerate timestamp generation(force-cfr)强制恒定帧速率时间戳生成(force-cfr)

Custom Command Line自定义命令行

额外参数选项

d2b5ca33bd20240108095722

HDR to SDR色彩映射,就是HDR转为SDR。此项没事不要勾选,会降质。要是你上传的网站有要求就选择。HDR和SDR详细情况请自行搜查,这里不作太详细说明。

1.HDR是英文HighDynamicRange(高动态范围)的缩写,这是一种后期处理技术。动态范围是指电信号最高和最低值的相对比值,反映在相片上就是高光区域和暗部区域可以显示出的细节动态范围越大层次就越丰富。

SDR(StandaRD Dynamic Range)即标准动态范围,是一种很常见的色彩显示方式。SDR信息大小比HDR更小,普及度高。我们前面说的HDR概念,也是相对于SDR提出的。

 

缩放过滤器

FAST_BILINEAR快速双线性缩放算法,此算法一般不建议,要是只图速度不求质量就无所谓了

BILINEAR双线性缩放算法

BICUBIC三次缩放算法 一般多数情况选这个就可以了

EXPERIMENTAL实验缩放算法

NEIGHBOR相邻重新缩放算法

AREA平均面积重新缩放算法。有较好的去波纹、噪点效果,会导致细节丢失。

BICUBLIN亮度分量三次缩放算法,双线性对色度分量,BICUBIC的升级版,可以尝试。

GAUSS高斯重新缩放算法

SINC正弦重新缩放算法

LANCZOS:Lanczos重新缩放算法。此算法是一种将对称矩阵通过正交相似变换,变成对称三角矩阵的过滤器。注重质量的放大算法,缩小画面时能保持较好锐度。 

SPLINE天然立方样条曲线重新缩放算法。注重质量的放大算法。

作过一些对比大致情况如下(仅供参考):

缩小视频图像最佳算法: Bicubic

放大动漫视频图像最佳: Lanczos

放大录像视频图像最佳: Spline

放大边缘完全没有过渡色的视频图像最佳: Bilinear

其它算法大家可自行尝试,不同算法可根据各种视频类型选择。

缩放过滤器

d2b5ca33bd20240108095735
图像位置一般默认“填充”就行,要是特殊情况就选择“裁剪”具体视情况而定。

图像比例一般默认“AUTO”就行,要是对画面尺寸作修改就根据情况选择其它值。

先来说PAR —— Pixel Aspect Ratio 像素横纵比。表示每个像素的宽度与长度的比值。可以认为每个像素不是正方形的。常用的PAR比率有(1:1,10:11, 40:33, 16:11, 12:11 )

DAR,Display_aspect_ratio显示横纵比:是指定该视频播放的时候,看到的视频比例。最终显示的图像在长度单位上的横纵比。一般来说 16:9 、 4:3 比较常见。

SAR,Sample Aspect Ratio采样横纵比:是指采集这个视频的比例,也就是存储像素点的比例。表示横向的像素点数和纵向的像素点数的比值。

采样纵横比的意义是用来计算实际要渲染的显示纵横比。实际开发中,我们只关心采样纵横比就可以。渲染图像要根据上面的公式计算出实际的显示纵横比,按照实际的显示纵横比去渲染,才不会出现图像拉伸的情况。

这两个中间如果有差别的话,肯定有一个因素,就是像素点不是矩形的,不是1:1的单个像素点。

这里就产生了PAR,Pixel Aspect Ratio

DAR = SAR x PAR

16:9和4:3指的是DAR,DAR和SAR之间没有必然联系。对于16:9的NTSC制式DVD来说,其理论上正确的SAR一定是40:33,但是在制作中做错SAR的DVD相当多

横向上的像素数目/纵向上的像素数目SAR=DAR或者PAR = DAR/SAR.

如果一段视频的DAR为4:3,它的SAR为VGA存储的4:3,那么可推出PAR为1:1,如果它的SAR为D-1 PAL存储的5:4,那么可以推出PAR为16:15

位置类型

d2b5ca33bd20240108095845

 

音频audio编码格式(编解码器):

常用的有AAC,AC3,EAC3,FLAC,MP2,MP3,OPUS,PCM,ALAC,AIFF,Monkey’s Audio(APE格式),WMA,WAV,OGG,DSD(DSF、DFF),vorbis(OGG、OPUS)等

1.MP3格式最常见的压缩音频格式,后面升级最高支持比特率320K,压缩率还可以但音质一般。

2.ACC其实就是AAC,是一种专为声音数据设计的文件压缩格式。与MP3不同,它采用了全新的算法进行编码,更加高效,具有更高的“性价比”。

3.WAV(WAVE)格式无损音频格式,微软开发无损数字音频格式,支持多种音频位数、采样频率和声道,采用44.1kHz的采样频率,16位量化位数,WAV的音质与CD相差十分接近。缺点是文件较大,一般是mp3的20倍以上。

4.AAC格式AAC实际上是高级音频编码的缩写。AAC是MPEG-2规范的一部分。AAC所采用的运算法则与MP3的运算法则有所不同,AAC通过结合其他的功能 来提高编码效率。AAC的音频算法在压缩能力上远远超过了以前的一些压缩算法(比如MP3等)。AAC可以在比MP3文件缩小30%的前提下提供更好的音质。ACC的比特率最高448kbps,AAC也是目前最好的压缩音频格式。

AAC(Advanced Audio Coding),中文名:高级音频编码,出现于1997年,基于MPEG-2的音频编码技术。由Fraunhofer IIS、杜比实验室、AT&T、Sony等公司共同开发,目的是取代MP3格式。

其实AAC的算法在1997年就完成了,当时被称为MPEG-2 AAC,因为还是把它作为MPEG-2(MP2)标准的延伸。但是随着MPEG-4(MP4)音频标准在2000年成型,AAC(M4A)。

5.FLAC、APE 都是常见的无损音频格式,FLAC体积大点,但是兼容性好。APE体积较小,编码速度偏慢。

6.CD—— 标准CD格式也就是44.1K的采样频率,速率1411K/秒,16位量化位数,因为CD音轨可以说是近似无损的,因此它的声音基本上是忠于原声的。

7.WMA——压缩音频格式是来自于微软的重量级选手,后台强硬,音质要强于MP3格式,更远胜于RA格式,它和日本YAMAHA公司开发的VQF格式一样,是以减少数据流量但保持音质的方法来达到比MP3压缩率更高的目的,WMA的压缩率一般都可以达到1:18左右,WMA的另一个优点是内容提供商可以通过DRM(Digital Rights Management)方案如Windows Media Rights Manager 7加入防拷贝保护。

8.OggVorbis(ogg)——是一种新的音频压缩格式,类似于MP3等现有的音乐格式。但有一点不同的是,它是完全免费、开放和没有专利限制的。

9.PCM是在CD和DVD中常用的格式,只不过实际使用的往往是它的衍生版本LPCM。如今使用的大多数PCM文件实际都采用LPCM,因此没必要对他们进行区分。

10.AIFF:1988年由苹果公司为Mac系统开发的,和微软与IBM为Windows开发WAV的目的如出一辙。类似WAV,AIFF也是一种音频容器。后缀是AIFF。 但是,大多数AIFF文件存储的也都是无压缩的PCM格式音频,它也是为Mac系统解码PCM的介质。也正如WAV在Mac上可以无障碍使用一样,Windows上也可以自由使用AIFF格式。

11.ALAC被很多人叫做Apple Lossless。 尽管ALAC很优秀,但它的效率并不如FLAC。但作为苹果公司自己开发的编码,它让苹果用户很难做出其他选择。iTunes和iOS系统都原生支持ALAC格式,但不支持FLAC。

12.AMR——自适应多速率编码,主要用于移动设备的音频存储,在手机端的一些音质存储上用的较多,在低码率下优势明显;当OPUS出来后,AMR其实还是有严重的挑战

13.OPUS——适用于网上上低延迟的即时声音传输, 这种有损压缩算法音质好、效率高、高低码率都可以,现在的WebRtc就用opus这种作为音频传输的重要算法;该算法以48kHz采样为主; 以后新的网络传输音频中,我认为这个会越来越多,因为它很强大

14.AC3——杜比的格式,多通道有优势(全称Audio Coding3音频编码3)是杜比数码的同义词,杜比数码是一种高级音频压缩技术,它最多可以对6个比特率最高为448kbps的单独声道进行编码。1997年初,杜比实验室正式将“杜比AC-3环绕声”改为“杜比数码环绕声”(Dolby Surround Digital),我们常称为Dolby Digital。

15.E-AC-3全称Enhanced AC-3 bit streams,与AC3类似,但不能后向兼容。AC3的decoder不能解EAC3的bitstream,EAC3的decoder即能解AC3,也能解EAC3。

针对高清电视HD DVDRip的一种音轨,就是Dolby Digital 2.0(杜比2.0),DD+、E-AC-3 、EC3三个说的是同一种格式,由于E-AC-3的音频文件后缀为.ec3,所以也有人成为EC3格式。

音频解码器

d2b5ca33bd20240108095925

其实mp3只是最常见的格式,比它音质好压缩率高还有m4a(AAC)。一般情况下容量为3-4M的是标准音质,8-10M是高品音质,20M左右为无损。

无损音质格式一般为flac、ape、wAV。前两个无损基本在20M左右,wAV比这两个大一点。100多M以上的dff、dsf无损音质,手机貌似不能播放,需要特定播放软件。暂时不介绍。以上数据仅供参考,以真实数据为准。

切记!标明无损也不一定是真无损,有专门的测试真假无损软件,比如可以用Spek,AU,ocenaudio,无损音乐检测工具等观测,这里也不多说,毕竟是无损真粉的事。

如果提示格式无法播放,请给文件重命名,把后缀改为手机可以播放的格式。比如flac可以改为mp3,在不行就转码。

如果想提取短视频或者mv中的音频,把视频格式改为mp3即可。但此方法有很大局限性,但不是所有文件改后缀都可行。切记切记。

无损:DSD,WAV,APE,FLAC区别:

DSD——发烧级专用

WAV——是无压缩的

APE, FLAC——是有压缩的

AMR——自适应多速率编码,主要用于移动设备的音频存储,在手机端的一些音质存储上用的较多,在低码率下优势明显;当OPUS出来后,AMR其实还是有严重的挑战

OPUS——适用于网上上低延迟的即时声音传输, 这种有损压缩算法音质好、效率高、高低码率都可以,现在的WebRtc就用opus这种作为音频传输的重要算法;该算法以48kHz采样为主; 以后新的网络传输音频中,我认为这个会越来越多,因为它很强大

AC3——杜比的格式,多通道有优势

d2b5ca33bd20240108100052

音频比特率也就是音频码率,和视频码率一样,在同一编码格式下数值越高往往音质就越好。

基本的算法是:【码率】(kbps)=【文件大小】(字节)X8/【时间】(秒)/1000

音频文件专用算法:【比特率】(kbps)=【量化采样点】(kHz)×【位深】(bit/采样点)×【声道数量】(一般为2)

一般普通音质码率大致在80~164kbps左右,HQ高音质192~320kbps左右,SQ无损800~1500kbps左右,CD及其它无压缩音质数值过万甚至更高。

不过要注意的是普通音质转成无损音质,并不是成了无损音乐,反而体积增大了,这就是所谓假无损。还有就80kbps的AAC(SBR增益)的音质要比普通128kbps(MP3)要好,256kbps(AAC)音质要比320kbps(MP3)好。要是听不出可通过Spek等工具对比频谱来判断。

在Spek软件下同一首歌频谱对比(左256AAC(Apple),右320MP3)

d2b5ca33bd20240108100115

Spek软件下同一首歌频谱对比(左256AAC(Apple),右WAV原无损文件)

d2b5ca33bd20240108100127

至于为什么AAC没有大范围普及取代MP3,原因很多(目前可能支持的设备少或者人们的使用习惯等)就不详说了,不过目前视频基本都用AAC编码,极个别也用AC3,因为这两个编码目前来说压缩率高,而且音质损失极底,所以被选用。

另外AAC三种规格形式LC,HE-AAC,HE-AACV2,:

其中HE-AAC,HE-AACV2就是AAC编码的SBR增益功能,一般这两个用于音频码率低于128kbps的情况下,其它情况一般选LC就行,高码率下几乎无差别。

HE:“High efficiency”(高效性)。HE-AAC v1(又称AACPlusV1,SBR),用容器的方法实现了AAC(LC)和SBR技术。SBR其实代表的是Spectral Band Replication(频段复制)。简要叙述一下,音乐的主要频谱集中在低频段,高频段幅度很小,但很重要,决定了音质。如果对整个频段编码,若是为了 保护高频就会造成低频段编码过细以致文件巨大;若是保存了低频的主要成分而失去高频成分就会丧失音质。SBR把频谱切割开来,低频单独编码保存主要成分, 高频单独放大编码保存音质,“统筹兼顾”了,在减少文件大小的情况下还保存了音质,完美的化解这一矛盾。 

HE-AAC全面支持所有广播相关元数据以及从单声道至48声道的任何信道配置,包括立体声与5.1环绕声。HE-AAC允许附加信息的传输,令未来电视的新服务成为可能,如旨在提高语音清晰度的Fraunhofer Dialogue Enhancement技术等。 

HEv2:用容器的方法包含了HE-AAC v1和PS技术。PS指“parametric stereo”(参数立体声)。原来的立体声文件文件大小是一个声道的两倍。但是两个声道的声音存在某种相似性,根据香农信息熵编码定理,相关性应该被去 掉才能减小文件大小。所以PS技术存储了一个声道的全部信息,然后,花很少的字节用参数描述另一个声道和它不同的地方。

HE-AACV2是由DASH行业论坛制定的DASH264兼容性指南中的必选立体声编解码器。HE-AAC 7.1也已被列为可选的多通道编解码器之一。

至于CBR(静态恒定码率)ABR(平均码率)VBR(动态码率)CVBR(升级动态码率),关系CVBR>VBR>ABR>CBR,跟视频编码一样动态比恒定体积大,但音质保存也相对好些。还有AAC编码一般用M4A格式封装。

AAC的几种过滤器Apple,Fdk,Nero,Winamp Fhg,XHE(新算法,一般不用,目前支持播放的设备寥寥无几)这些在这就不详说了,音频编码一般用Apple可以说是最好的有损过滤器。

有关音频编码说的够多了,要是大家需要编辑转换歌曲或其它一些音乐音频文件这里推荐用foobar2000这个工具,具体在这就不说了,有兴趣的可以自行去学习研究,但是大家尽量不要用视频转码软件转码音频,转是能转但是效果不如专门的音频转码工具,所以大家选用工具是要根据具体情况对待。

音频比特率(码率)

d2b5ca33bd20240108100155

foobar2000界面

d2b5ca33bd20240108100209

声道(Sound Channel) 

是指声音在录制或播放时在不同空间位置采集或回放的相互独立的音频信号,所以声道数也就是声音录制时的音源数量或回放时相应的扬声器数量。

声卡所支持的声道数是衡量声卡档次的重要指标之一,从单声道到最新的环绕立体声。

原版:很显然就是默认采用原视频的声道,无特殊情况一般音视频编码默认此项即可。

单声道mono:是指一个声音的通道,把来自不同方位的音频信号混合后统一由录音器材把它记录下来,再由一个扬声器进行重放(没有左右声道之分)。早期的收音机都是单声道的,耳机就一个耳朵。

双声道:是指有两个声音的通道,双声道是在空间放置两个互成一定角度的扬声器,每个扬声器单独由一个声道提供信号。双声道是二路输入,二路输出,但不一定是立体声。(左右声道都只有一路的信号输入),也称为双声道混和声。

而立体声Stereo是左右两路分离独立输入,经过立体声编码解码后,左右两路独立输出到双扬声器。立体声是双声道的一种,但双声道不一定是立体声。

立体声的先决条件是立体声编码和解码的过程。达到这一条件的才称的上是真正的立体声了。(关键是立体声编码解码电路,立体声形成的过程)目前大多网络视频都是2声道。

二者区别:

1、性质不同

单声道是指一个声音的通道,用一个传声器拾取声音,用一个扬声器进行放音的过程。

双声道就是指有两个声音的通道。

2、原理不同

单声道是把来自不同方位的音频信号混合后统一由录音器材把它记录下来,再由一只音箱进行重放。

双声道就是实现立体声的原理,在空间放置两个互成一定角度的扬声器,每个扬声器单独由一个声道提供信号。而每个声道的信号在录制的时候就经过了处理:处理的原则就是模仿人耳在自然界听到声音时的生物学原理,表现在电路上基本也就是两个声道信号在相位上有所差别,这样当站到两个扬声器的轴心线相交点上听声音时就可感受到立体声的效果。

3、特点与应用不同

在单声道的音响器材中,只能感受到声音、音乐的前后位置及音色、音量的大小,而不能感受到声音从左到右等横向的移动。所重播时的效果相对于真实的自然声来说,是简单化的,是失真了的。

在电视广播中,单声道伴音质量欠佳,特别是遇到优势的文艺节目,尤其是现场直播高水平的音乐表演时就显得逊色不少。

双声目前最常用途:卡拉OK中,一个是奏乐,一个是歌手的声音。VCD中,一个是普通话配音,一个是粤语配音。

在购买的MTV碟片中,一般都是有两个声道的,即一边为音乐伴音,一边为原唱,可以供唱卡拉OK的人使用,可以通过影碟机的声道转换方便的转化。

多声道Dolby Stereo的定义:

双声道的Hi-Fi系统(高保真系统)与多声道的AV系统(家庭影院系统)是音响器材市场的两大阵营。还有一种7.1声道系统,实际上,7.1声道是在系统中使用一对后环绕扬声器来代替6.1声道的一只后环绕扬声器。6.1声道的影片越来越多,还没有一部7.1声道的影片出现。这是因为这个7.1声道系统并不是一个行业标准,而是一项由某些音响器材公司研发出来的,并将相关技术应用在影院功放上的技术。在7.1声道系统中,Back Surround(后中置)的单声道信号经过矩阵运算,加入延时、回响等多项参数之后,被分配到左后环绕与右后环绕两个声道中,而不是简单地将一路单声道信号平均分配到两个后环绕声道中来。简而言之,这种方案最大的优点就是进一步增强了后部声场的方向感和声像移动的连贯性与真实性。

5.1 声道:即Dolby Digital5.1 和DTS5.1 两种数字多声道环绕声音频格式。它具有左 右两路主声道、中置声道、左右两路环绕声道和一个重低音声道。前面5 个声道都是全频域 声道,重低音声道是一个不完全声道,只发120Hz 以下的低音,称之为0.1 声道,这样便构 成了5.1 声道格式。 6.1 声道:指Dolby DigitalEX 和DTS ES 两种数字多声道环绕声音频格式。它们都是一 种扩展型环绕声音频格式即分别在Dolby Digital5.1 和DTS5.1 的基础上,为了让左右环绕 声衔接得更好而增加一路后中间环绕声道,这便形成了6.1 声道格式。 

7.1 声道:指THX Surround EX 系统。THX 是Lucas 公司对电影院的一种认证标准,不是 音频格式。它严格地制订了电影院相关影音器材与环境的标准,只要符合THX 标准且经过认 证,就能有相当的水准。这样只要消费者选择具有THX 认证的影院,就会有绝佳的影音享受。 后来THX 被移植到家庭影院,用于认证高品质的视听器材,并针对家庭环境的不同有着独特 的要求。例如在5.1 声道系统中,它要求的环绕声是双向发声的侧声道,而非单向发声的后 声道,以达到电影院那种多只扬声器阵列排列的效果。可见 THX 并非Dolby Digital 和DTS 那样为一种音频格式,而是一种音频后处理模式,目的是获得最佳的视听享受。当6.1 声道 的Dolby Digital EX 和DTS ES 出来后,THX 将其进一步演化成THX SurroundEX 系统。为了 兼容原双向发声的侧声道和再度加强环绕声效包围感,于是在原侧声道的基础上又增加了两 只后声道,这就构成了7.1 声道。值得注意的是,THX Surround EX 是将Dolby Digital EX 和DTS ES 的6.1 声道扩展成7.1 声道,并不是一种音频录音格式,它只是将其环绕声效表现更佳而已。

5.1是立体环绕声,7.1是更强大的系统,比5.1多两个声道。7.1声道比5.1声道多一个环绕音响,7.1声道在5.1声道的主音箱与后环绕音箱中间加入环绕音箱。

7.1环绕其实是虚拟的,实际上只有5个音区(左前方环绕、右前方环绕、中置环绕、左后方环绕、右后方环绕)。剩余2个音区(左环绕、右环绕)是从主音区分配来的。

音频采样率

d2b5ca33bd20240108100234

音频采样率audio sample rate

指录音设备在单位时间内对模拟信号采样的多少,采样频率越高,机械波的波形就越真实越自然。在当今的主流采集卡上,采样频率一般共分为11025Hz、22050Hz、24000Hz、44100Hz、48000Hz五个等级,11025Hz能达到AM调幅广播的声音品质,而22050Hz和24000HZ能达到FM调频广播的声音品质,44100Hz则是理论上的CD音质界限,48000Hz则更加精确一些。

在数字音频领域,常用的采样率有:

8,000 Hz – 电话所用采样率, 对于人的说话已经足够

11,025 Hz – 电话所用采样率

22,050 Hz – 无线电广播所用采样率

32,000 Hz – miniDV 数码视频 camcoRDer、DAT (LP mode)所用采样率

44,100 Hz – 音频 CD, 也常用于 MPEG-1 音频(VCD, SVCD, MP3)所用采样率

47,250 Hz – Nippon Columbia (Denon)开发的世界上第一个商用 PCM 录音机所用采样率

48,000 Hz – miniDV、数字电视、DVD、DAT、电影和专业音频所用的数字声音所用采样率

50,000 Hz – 二十世纪七十年代后期出现的 3M 和 Soundstream 开发的第一款商用数字录音机所用采样率

50,400 Hz – 三菱 X-80 数字录音机所用所用采样率

96,000 或者 192,000 Hz – DVD-Audio、一些 LPCM DVD 音轨、BD-ROM(蓝光盘)音轨、和 HD-DVD (高清晰度 DVD)音轨所用所用采样率

2.8224 MHz – SACD、 索尼 和 飞利浦 联合开发的称为 Direct Stream Digital 的 1 位 sigma-delta modulation 过程所用采样率。

目前市面上大多音视频采用44.1KHZ,和48KHZ

采样位数也就是音频位深,可以理解数字音频设备处理声音的解析度,即对声音的辨析度。就像表示颜色的位数一样(8位表示256种颜色,16位表示65536种颜色),有8位,16位,24位等。这个数值越大,解析度就越高,录制和回放的声音就越真实。视频编码一般可以不用或默认,无损音质一般大多采用16位

其它杂项:

水平翻转,垂直翻转,隔行扫描,旋转这些项目根据具体情况勾选,可以通过预览视频来观察调整设置。

色调:数值范围在-180~180之间,色彩饱和度数值范围在-10~10之间,可以通过预览视频来观察调整设置。

色调tone是指图像的相对明暗程度,在彩色图像上表现为颜色。色调是地物反射、辐射能量强弱在图像上的表现,地物的属性、几何形状、分布范围和组合规律都能通过色调差异反映在遥感图像上。

色调是指一幅作品色彩外观的基本倾向。在明度、纯度、色相这三个要素中,某种因素起主导作用,我们就称之为某种色调。通常可以从色相、明度、冷暖、纯度四个方面来定义一幅作品的色调。

滤镜filter,主要是用来实现图像的各种特殊效果。视频滤镜是视频特效中的一种,主要是用来实现图像或视频的各种特殊效果。

对比度Contrast ratio:是画面黑与白的比值,也就是从黑到白的渐变层次。 比值越大,从黑到白的渐变层次就越多,色彩表现也就越丰富。 其实对比度对视觉效果的影响非常的关键,一般来说对比度越大,图像越清晰醒目,色彩也越鲜明艳丽;而对比度小,则会让整个画面都灰蒙蒙的。范围在-2~2之间(默认1.0或者不启用)

亮度Luminance:是指发光物体表面发光强弱的物理量称为亮度(luminance),物理学上用L表示,单位为坎德拉每平方米或称尼特。亮度是衡量显示器屏幕发光强度的重要指标,对于显示器面板来说,高亮度也意味着对其工作环境的抗干扰能力更高。范围在-1~1之间(默认0.0或者不启用)

饱和度saturation:指色彩的鲜艳程度,也称色彩的纯度。饱和度取决于该色中含色成分和消色成分(灰色)的比例。含色成分越大,饱和度越大;消色成分越大,饱和度越小。饱和度可定义为彩度除以明度,与彩度同样表征彩色偏离同亮度灰色的程度。与彩度完全不是同一个概念。但由于其代表的意义与彩度相同,所以才会出现视彩度与饱和度为同一概念的情况。饱和度是视频中重要的组成因素,也是影响视频输出效果的重要因素之一。范围在0~3之间(默认1.0或者不启用)

伽玛值Gamma:指印刷技术或图象处理上,输入值和显示器输出时的亮度之间的关系,其影响原稿上高光到暗调之间色调的分布。 就是指数函数中的幂。 没有彩色管理,用户可调整显示器的伽玛值,以模拟在比较显示器上与原稿上的图像的反差时的观视条件。 在使用彩色匹配软件时,系统特地指定了显示器的伽玛值。 伽玛值 ( Gamma )表示图象输出值与输入值关系的斜线。 (有时也用于描述屏幕的反差) Gamma可能源于CRT(显示器/电视机)的响应曲线,即其亮度与输入电压的非线性关系。 gamma就是 指数函数 中的幂。 RGB值与功率并非简单的线性关系,而是幂函数关系,这个函数的指数称为Gamma值,一般为2.2,而这个换算过程,称为Gamma校正。范围在0.1~10之间(默认1.0或者不启用)

模糊/锐化范围在-2~5之间(默认0或者不启用)大于0就是锐度小于0就是朦胧度。视频锐利度差不多跟图片意思差不多,就是处理视频图像边缘轮廓线,提高图像中某一部位的清晰度或者焦距程度,使图像特定区域的色彩更加鲜明。但一定要适度。锐化不是万能的,很容易使东西不真实。

以上这些杂项一般用于视频编辑剪辑软件,像这种转码软件也就大致附带一些随便调整一些视频画面,多数情况下一般不用,要是需要用在转换视频前就先设置预览后再确定。

杂项滤镜

d2b5ca33bd20240108100256

字幕subtitles of motion picture是指以文字形式显示电视、电影、舞台作品中的对话等非影像内容,也泛指影视作品后期加工的文字。在电影银幕或电视机荧光屏下方出现的解说文字以及种种文字,如影片的片名、演职员表、唱词、对白、说明词以有人物介绍、地名和年代等都称为字幕。影视作品的对话字幕,一般出现在屏幕下方,而戏剧作品的字幕,则可能显示于舞台两旁或上方。

视频字幕如同音乐歌词一样就是通过文字展示音视频中的对话和唱词。不过二者格式不同,电影字幕格式有utf .idx .sub .srt .smi .rt .txt .ssa .aq .jss .js .ass,目前最常用大多srt或ass,歌词格式有初步分析 LRC、TRC、KRC、QRC、KSC(主要用于卡拉OK形式) 和 KAJ,网上最常用的一般都是LRC。

字幕的几种形式:内置字幕、内挂字幕、外挂字幕、内嵌字幕、封装字幕

内置字幕:也就是硬字幕,就是内嵌字幕和视频融为一体。优点:比较稳定,不受播放器影响,有利于分享传播缺点:对视频内容有影响,不利于字幕修改

外挂字幕:顾名思义就是独立于视频之外的字幕文件,常见格式有’srt’和’ass’,srt 是简单的纯文本字幕,体积小兼容性好,但是无法使用华丽的特效字体;ass 属于高级字幕,可以制作出华丽的特效字幕,只是体积稍大一些。外挂字幕需要你自行下载。外挂字幕是独立存在的,不需要提取

内挂字幕:前面说了外挂字幕需要你自行下载并加载,这一点上内挂字幕就比较省事了,因为在视频压制的时候,制作者已经下载了匹配的字幕并将字幕和视频封装在一起,这就省去了你再去找字幕的麻烦,你只需要点击播放字幕就会自动加载。当然如果你觉得视频内挂的字幕效果不好,也可以去下载一个外挂字幕在播放器中进行替换即可。

内嵌字幕:和外挂和内挂的可替换的挂载形式不同,内嵌字幕一旦内嵌是不可替换的,因为这个类型的字幕已经和视频合二为一了。在我看来内嵌字幕是最好的字幕形式,但是由于内嵌压制比较耗时间,而且必须保证字幕的正确性,所以比较麻烦就是了。内嵌字幕和封装字幕,都可以使用绘影字幕-内嵌字幕提取功能。我们会根据视频类型,进行ocr识别,或者使用MKV提取工具,将字幕提取出来,生成srt/txt等格式的字幕文件。

封装字幕:也就是软字幕,拥有这种字幕的视频格式是MKV。其实MKV中是有多条轨道的,在MKV里,视频、音频、字幕都是单独的轨道,MKV只是一个将这些轨道封装在一起的“容器”。但是它的字幕文件却不像外挂字幕那样,所以MKV的字幕是不能直接拿来用的;不过也区别于内嵌字幕,字幕已经变成图像。要是想把MKV里的字幕提取出来,用一下特殊的工具,也是能实现的。

字幕样式和颜色,大小等这些可根据自身情况去设定。

字幕

d2b5ca33bd20240108100336

 

动态音频规范器:此项一般不用,勾选了此项很多时候会让视频声音变得奇怪。

动态扩展器和压缩器实际上是一种增益可变的放大器,压缩器对小信号的放大量较大,而对大信号的放大量较小,因而当大信号到来时,其幅度被压缩,与此相反。动态扩展器对小信号的放大量更小,对大信号的放大量更大,即扩大了动态范围;同时.由于噪声的电平一般低于信号电平,经扩展后就更低,因而提高了信噪比。

音量:这里分两种情况,在不带单位dB分贝的情况下数值在0~30,加了dB数值在-50~50,数值越大声音越响亮。根据视频声音情况选用设置

Volume音量又称音强、响度,是指人耳对所听到的声音大小强弱的主观感受,其客观评价尺度是声音的振幅大小。这种感受源自物体振动时所产生的压力,即声压。物体振动通过不同的介质,将其振动能量传导开去。人们为了对声音的感受量化成可以监测的指标,就把声压分成“级”——声压级,以便能客观的表示声音的强弱,其单位称为“分贝”(dB)。

音频均衡器:也叫声音均衡器,是一种可以分别调节各种频率成分电信号放大量的电子设备,通过对各种不同频率的电信号的调节来补偿扬声器和声场的缺陷,补偿和修饰各种声源及其它特殊作用,一般调音台上的均衡器仅能对高频、中频、低频三段频率电信号分别进行调节。均衡器可分为三类:图示均衡器,参量均衡器和房间均衡器。此项一般视频编码很少用,一般多用于MV或音乐歌曲类文件。

删除人声就是去除视频内的人声。额外立体声,此项一般不勾选,具体可以自己尝试设置启用Earwax,大致是修改音频率的,一般不用管此项。

音频扩展项
删除原数据大概就是去除原视频内的注释信息改为当前编辑信息,比如原视频编码程序为TMPGEnc Video Mastering Works,由ShanaEncoder转码后就改为了ShanaEncoder。

其它杂项
其它一些选项什么Logo啥的就不说了,以上内容源于网络和个人经验知识,其图片来源于个人截屏,由本人整理而成。若有什么遗漏和不足之处含望各位在评论区补充和纠正。

作者:暗影哥特-无尽梦魇

本文为转载 暗影哥特-无尽梦魇 的违章,作为博主备忘录

------本页内容已结束,喜欢请分享------

感谢您的来访,获取更多精彩文章请收藏本站。

------关注微信公众号:胖大海TuT------
© 版权声明
THE END
喜欢就支持一下吧
点赞460 分享
评论 抢沙发

请登录后发表评论

    暂无评论内容