FFmpeg码率控制及内置编码参数介绍

发布于 2020-12-18  412 次阅读


原文地址

  • 一、码率控制参数
  • 二、编码速度 & 编码质量 & 视觉优化参数

一、码率控制:

码率控制:码率控制是一种决定为每一个视频帧分配多少比特数的方法,它将决定文件的大小和质量的分配。

普通用户常用 CRF、Two-Pass ABR 两种

CRF(Constant Rate Factor - 限制码率因子)

适用范围

优点:该方法在输出文件的大小不太重要的时候,可以使整个文件达到特定的视频质量。该编码模式在单遍编码模式下提供了最大的压缩效率,每一帧可以按照要求的视频质量去获取它需要的比特数。
缺点:不好的一面是,你不能获取一个特定大小的视频文件,或者说将输出位率控制在特定的大小上。

参数解析

1) 量化比例的范围为 0~51,其中 0 为无损模式,23 为缺省值,51 可能是最差的。该数字越小,图像质量越好。从主观上讲,18~28 是一个合理的范围。18 往往被认为从视觉上看是无损的,它的输出视频质量和输入视频一模一样或者说相差无几。但从技术的角度来讲,它依然是有损压缩。
2) 若 Crf 值加 6,输出码率大概减少一半;若 Crf 值减 6,输出码率翻倍。通常是在保证可接受视频质量的前提下选择一个最大的 Crf 值,如果输出视频质量很好,那就尝试一个更大的值,如果看起来很糟,那就尝试一个小一点值。

使用方法 - 命令行

ffmpeg -i <input> -c:v libx264 -crf 23 <output>
ffmpeg -i <input> -c:v libx265 -crf 28 <output>
ffmpeg -i <input> -c:v libvpx-vp9 -crf 30 -b:v 0 <output>

使用方法 - 源码
在代码中使用时,通过 av_dict_set 设置到 AVDictionary 中,并作为参数传递给 avcodec_open2 即可

av_opt_set(pCodecCtx->priv_data,"crf",modeValue.c_str(),AV_OPT_SEARCH_CHILDREN);

Two-Pass ABR(两遍模式)

适用范围:如果你的目标是一个确定大小的文件而且帧与帧之间的视频质量并不重要,这个方法很适用。这通过一个例子可以得到很好地解释。比如预期视频文件有 10min(600s),200 MB: 200 * 8192 / 600 = ~2730 Kb 2730 - 128(音频常用的比特率) = 2602 kb

使用方法 - 命令行

ffmpeg -y -i input -c:v libx264 -b:v 2600k -pass 1 -c:a aac -b:a 128k -f mp4 /dev/null && \
ffmpeg -i input -c:v libx264 -b:v 2600k -pass 2 -c:a aac -b:a 128k output.mp4
//如果是 Windows 环境, /dev/null 换为 NUL,\ 换为 ^

其他码率控制方式

ABR(Average Bitrate - 平均码率)

解析

它提供了某种 “运行均值” 的目标,终极目标是最终文件大小匹配这个 “全局平均” 数字(因此基本上来说,如果编码器遇到大量码率开销非常小的黑帧,它将以低于要求的比特率编码,但是在接下来几秒内的非黑帧它将以高质量方式编码方式使码率回归均值)使用两遍编码模式时这个方法变得更加有效,你可以和 “max bit rate ” 配合使用来防止码率的波动。

使用方法 - 命令行

ffmpeg -i <input> -c:v libx264 -b:v 1M <output>
ffmpeg -i <input> -c:v libx265 -b:v 1M <output>
ffmpeg -i <input> -c:v libvpx-vp9 -b:v 1M <output>

使用方法 - 源码
如果设置了 AVCodecContext 中 bit_rate 的大小,则采用 abr 的控制方式
如果没有设置 AVCodecContext 中的 bit_rate,则默认按照 crf 方式编码,crf 默认大小为 23

CBR(Constant BitRate - 恒定码率)

解析

事实上根本就没有 CBR 这种模式,但是你可以通过补充 ABR 参数 “模拟” 一个恒定比特率设置。

使用方法 - 命令行

ffmpeg -i <input> -c:v libx264 -x264-params "nal-hrd=cbr:force-cfr=1" -b:v 1M -minrate 1M -maxrate 1M -bufsize 2M <output>
// VP9
ffmpeg -i <input> -c:v libvpx-vp9 -b:v 1M -maxrate 1M -minrate 1M <output>

CQP(Constant Quantization Parameter - 固定质量参数)

解析

值越大,压缩率越大,质量越低。

使用方法 - 命令行

ffmpeg -i <input> -c:v libx264 -qp 23 <output>
ffmpeg -i <input> -c:v libx265 -x265-params qp=23 <output>

最大比特率的 CRF/2-pass 模式

你可以通过声明 - maxrate 确保最大码率限制在一个范围里,对于流式传输非常有用,可以配合到(2-Pass)ABR 或 CRF 模式一起使用。

使用方法 - 命令行

// crf
ffmpeg -i <input> -c:v libx264 -crf 23 -maxrate 1M -bufsize 2M <output>
ffmpeg -i <input> -c:v libx265 -crf 28 -x265-params vbv-maxrate=1000:vbv-bufsize=2000 <output>
ffmpeg -i <input> -c:v libvpx-vp9 -crf 30 -b:v 2M <output>
// 2-pass abr & vbv
ffmpeg -i <input> -c:v libx264 -b:v 1M -maxrate 1M -bufsize 2M -pass 1 -f mp4 /dev/null
ffmpeg -i <input> -c:v libx264 -b:v 1M -maxrate 1M -bufsize 2M -pass 2 <output>

ffmpeg -i <input> -c:v libx265 -b:v 1M -x265-params pass=1:vbv-maxrate=1000:vbv-bufsize=2000 -f mp4 /dev/null
ffmpeg -i <input> -c:v libx265 -b:v 1M -x265-params pass=2:vbv-maxrate=1000:vbv-bufsize=2000 <output>

ffmpeg -i <input> -c:v libvpx-vp9 -b:v 1M -maxrate 1M -bufsize 2M -pass 1 -f webm /dev/null
ffmpeg -i <input> -c:v libvpx-vp9 -b:v 1M -maxrate 1M -bufsize 2M -pass 2 <output>

编写代码的话,指定 AVCodecContext 的 rc_max_rate 和 rc_buffer_size 即可。bufsize 根据你希望比特率获得多大的可变性而设置,默认为 maxrate 的两倍,如果想限制流的比特率,可以设置为 maxrate 的一半。

配合 CRF 模式使用的时候,如果设置的 crf 值过低,视频码率可能超出 -maxrate 的时候,编码器会自动调整 crf,避免出现较大的码率波动。然而,x264 不会严格控制你指定的最大码率,除非使用 2 pass 模式。

使用方法 - 源码

av_opt_set(pCodecCtx->priv_data,"qp",modeValue.c_str(),AV_OPT_SEARCH_CHILDREN);

二、编码速度 & 编码质量 & 视觉优化参数

preset

主要调节编码速度和质量的平衡,有 ultrafast、superfast、veryfast、faster、fast、medium、slow、slower、veryslow、placebo 这 10 个选项,从快到慢。

tune

主要配合视频类型和视觉优化的参数况。如果视频的内容符合其中一个可用的调整值又或者有其中需要,则可以使用此选项,否则建议不使用(如 tune grain 是为高比特率的编码而设计的)。

tune 的值有: film: 电影、真人类型;
animation: 动画;
grain: 需要保留大量的 grain 时用;
stillimage: 静态图像编码时使用;
psnr: 为提高 psnr 做了优化的参数;
ssim: 为提高 ssim 做了优化的参数;
fastdecode: 可以快速解码的参数;
zerolatency:零延迟,用在需要非常低的延迟的情况下,比如电视电话会议的编码。

profile

H.264 有四种画质级别, 分别是 baseline, extended, main, high:
  1、Baseline Profile:基本画质。支持 I/P 帧,只支持无交错(Progressive)和 CAVLC;
  2、Extended profile:进阶画质。支持 I/P/B/SP/SI 帧,只支持无交错(Progressive)和 CAVLC;(用的少)
  3、Main profile:主流画质。提供 I/P/B 帧,支持无交错(Progressive)和交错(Interlaced),
    也支持 CAVLC 和 CABAC 的支持;
  4、High profile:高级画质。在 main Profile 的基础上增加了 8x8 内部预测、自定义量化、 无损视频编码和更多的 YUV 格式;
H.264 Baseline profile、Extended profile 和 Main profile 都是针对 8 位样本数据、4:2:0 格式 (YUV) 的视频序列。在相同配置情况下,High profile(HP)可以比 Main profile(MP)降低 10% 的码率。
根据应用领域的不同,Baseline profile 多应用于实时通信领域,Main profile 多应用于流媒体领域,High profile 则多应用于广电和存储领域。

设置 preset、tune、profile

使用方法 - 命令行
命令行的方式详见文档
使用方法 - 源码

av_dict_set(&dictParam,"preset","medium",0);
        av_dict_set(&dictParam,"tune","zerolatency",0);
        av_dict_set(&dictParam,"profile","main",0);
    ...
    avcodec_open2(pCodecCtx, pCodec,&dictParam);

参考:
https://www.jianshu.com/p/aac3e2a209c3
https://blog.csdn.net/owen7500/article/details/51832035
https://trac.ffmpeg.org/wiki/Encode/H.264
https://www.cnblogs.com/tinywan/p/6402007.html


或许明日太阳西下倦鸟已归时