马上注册,结交更多好友,享用更多功能,让你轻松玩转社区。
您需要 登录 才可以下载或查看,没有帐号?快速注册
x
高清视频知识
1 E, Y8 d. F/ L! \& U2 q& Q& e1、封装格式(MP4/MKV…) vs 媒体格式(H.264/FLAC/AAC…)
/ c |1 E( c6 k0 {3 t% K2、视频的基础参数:分辨率,帧率和码率! l9 i, ^) S1 B
3、图像的表示方法:RGB模型 vs YUV模型
) R. x- G( @6 q3 X# m4、色深
B& Z5 N5 k9 V5、色度半采样/ r/ X/ P% M2 ?. C: L/ T9 K2 [
6、空间上的低频与高频:平面,纹理和线条4 o# D7 r, R/ S5 F/ B; |
7、时间上的低频与高频:动态# N3 n5 }8 z! v3 \- ~& F
8、清晰度与画质简述. t" W$ l1 F$ }: b. T& L
2 G t, R) y# j1 b+ v- P" A% }1、封装格式(MP4/MKV…) vs 媒体格式(H.264/FLAC/AAC…)
* C1 p( Z" W7 g7 Y2 |$ tMP4+MKV是你下载的视频文件最常见的种类。这些文件其实类似一个包裹,它的后缀则是包裹的包装方式。这些包裹里面,包含了视频(只有图像),音频(只有声音),字幕等。当播放器在播放的时候,首先对这个包裹进行拆包(专业术语叫做分离/splitting),把其中的视频、音频等拿出来,再进行播放。' ~, l3 b% s+ G4 @4 I) |( n! a% J
包裹里面的每一件物品,我们称之为轨道(track),一般有这么些:
) d& X- R& u! j$ T视频(Video): 一般来说肯定都有,但是也有例外,比如mka格式的外挂音轨,其实就是没视频的mkv。注意我们说到视频的时候,是不包括声音的。! ?8 z* B8 x, v8 g* L* q3 H _4 O
音频(audio):一般来说也肯定有,但是有些情况是静音的,就没必要带了。
$ D( @5 j3 H3 V( y1 E; O7 R章节(Chapter): 蓝光原盘中自带的分段信息。如果文件带上了,那么你可以在播放器中看到带章节的效果:. l6 D; o) L' w4 i/ v0 W9 m
每个轨道,都有自己的格式。比如大家常说的,视频是H.264,音频是AAC,这些就是每个轨道的格式。! ~+ g6 W# p: G! U1 d1 A% Z
视频的格式,常见的有H.264(可以细分为8bit/10bit),H.265(当前也有8bit/10bit之分),RealVideo(常见于早期rm/rmvb),VC-1(微软主导的,常见于wmv)。基本上,H.264=AVC=AVC1, H.265=HEVC。1 _5 |- S8 z2 e( t2 O
音频的格式,常见的有 FLAC/ALAC/TrueHD/DTS-HD MA这四种无损,和AAC/MP3/AC3/DTS(Core)这四种有损。
$ D8 `0 f, b: p" N: k, ]. m {8 IMKV vs MP4,主要的区别在于:) e- a# T, ], O7 v/ W
MKV支持封装FLAC作为音频,MP4则不支持。但是MP4也可以封装无损音轨(比如说ALAC,虽然普遍认为ALAC的效率不如FLAC优秀)( u9 s) s+ S6 n3 X( @4 E
MKV支持封装ASS/SSA格式的字幕,MP4则不支持。一般字幕组制作的字幕是ASS格式,所以内封字幕多见于MKV格式
& y! L! `$ K$ L; x3 f) ~1 ]MP4作为工业标准,在视频编辑软件和播放设备上的兼容性一般好于MKV。这也是vcb-s那些为移动设备优化的视频基本上选择MP4封装的原因。; G Q5 M$ R( F! ~+ i
MKV是民间研发,为了代替古老的AVI,从而更好地支持H264,它开发和修改的灵活度使得它可以兼容flac/ass这类非工业标准的格式;而MP4则是出生豪门,作为工业标准,替代更古老的MPG,作为新一代视频/音频封装服务的。# V" \1 W' W+ ]* H: f5 Y
- l. T- Z; G+ I. B X3 t2、视频的基础参数:分辨率,帧率和码率。
/ q2 j9 m+ |, q2 }) ?3 I8 J视频是由连续的图像构成的。每一张图像,我们称为一帧(frame)。图像则是由像素(pixel)构成的。一张图像有多少像素,称为这个图像的分辨率。比如说1920×1080的图像,说明它是由横纵1920×1080个像素点构成。视频的分辨率就是每一帧图像的分辨率。# Z# E0 E/ P! ^# r) K
0 |. w7 D3 P* u9 k( b) W! |$ ^
一个视频,每一秒由多少图像构成,称为这个视频的帧率(frame-rate)。常见的帧率有24000/1001=23.976, 30000/1001=29.970, 60000/1001=59.940,比如23.976,就是1001秒内,有24000张图像。视频的帧率是可以是恒定的(cfr, Const Frame-Rate),也可以是变化的(vfr, Variable Frame-Rate)% Q# y# p- K: E! N% T7 h, e
码率的定义是视频文件体积除以时间。单位一般是Kbps(Kbit/s)或者Mbps(Mbit/s)。注意1B(Byte)=8b(bit)。所以一个24分钟,900MB的视频:3 W2 h5 G. I+ m: D3 s
体积:900MB = 900MByte = 7200Mbit- t; N. U! g: o- o/ R/ w" V* g& f
时间:24min = 1440s6 Q% @# W! ~$ }5 h2 A4 ^- p
码率:7200/1440 = 5000 Kbps = 5Mbps
( J7 b2 O- @: d7 `6 p5 R- g5 |7 a) `3、图像的表示方法:RGB模型 vs YUV模型
2 J# e0 i% a: G; d光的三原色是红(Red)、绿(Green)、蓝(Blue)。现代的显示器技术就是通过组合不同强度的三原色,来达成任何一种可见光的颜色。图像储存中,通过记录每个像素红绿蓝强度,来记录图像的方法,称为RGB模型 (RGB Model)1 a( r- W7 g3 n# Q; W8 U/ }
常见的图片格式中,PNG和BMP这两种就是基于RGB模型的。* [" G7 `$ L' B: a
除了RGB模型,还有一种广泛采用的模型,称为YUV模型,又被称为亮度-色度模型(Luma-Chroma)。它是通过数学转换,将RGB三个通道,转换为一个代表亮度的通道(Y,又称为Luma),和两个代表色度的通道(UV,并成为Chroma)。
2 P; }" K6 ~! m/ e
. v5 E! i* b6 y9 i8 s在图像视频的加工与储存中,YUV格式一般更受欢迎,理由如下:
5 m8 k" {: M+ H; `
" h2 W* k B! Z/ b- }* @( [' R1、人眼对亮度的敏感度远高于色度,因此人眼看到的有效信息主要来自于亮度。YUV模型可以将绝大多数的有效信息分配到Y通道。UV通道相对记录的信息少的多。相对于RGB模型较为平均的分配,YUV模型将多数有效信息集中在Y通道,不但减少了冗余信息量,还为压缩提供了便利
" }+ Q I% l" U% M$ C2、保持了对黑白显示设备的向下兼容
$ F: E. q4 n2 J o3、图像编辑中,调节亮度和颜色饱和度,在YUV模型下更方便。
/ }, T/ t8 ^! Z* \0 R几乎所有的视频格式,以及广泛使用的JPEG图像格式,都是基于YCbCr模型的。播放的时候,播放器需要将YCbCr的信息,通过计算,转换为RGB。这个步骤称为渲染(Rendering)
" z8 k- Y6 L$ a$ \) [0 F每个通道的记录,通常是用整数来表示。比如RGB24,就是RGB各8个bit,用0~255 (8bit的二进制数范围)来表示某个颜色的强弱。YUV模型也不例外,也是用整数来表示每个通道的高低。6 O D+ ^# k7 c3 i
# M' E. X1 c1 x9 `( t' }
4、色深, c7 `* I2 l: Q/ x c5 r
色深(bit-depth),就是我们通常说的8bit和10bit,是指每个通道的精度。8bit就是每个通道用一个8bit整数(0~255)代表,10bit就是用10bit整数(0~1023)来显示。16bit则是0~65535
7 p8 @! i6 N8 U2 E J
7 y' |9 U- H, l' f: K9 U6 R8 t) E/ S' x5、色度半采样& G* [- [' V% C6 e. x4 y
4 H1 c" d. J; L; Q c
在YUV模型的应用中,Y和UV的重要性是不等同的。图像视频的实际储存和传输中,通常将Y以全分辨率记录,UV以减半甚至1/4的分辨率记录。这个手段被称为色度半采样(Chroma Sub-Sampling)。色度半采样可以有效减少传输带宽,和加大UV平面的压缩率,但是不可避免的会损失UV平面的有效信息。
. p! I. [& f& k( K) J我们平常的视频,最常见的是420采样。配合YUV格式,常常被写作yuv420。这种采样是Y保留全部,UV只以(1/2) x (1/2)的分辨率记录。比如说1920×1080的视频,其实只有亮度平面是1920×1080。两个色度平面都只有960×540的分辨率。
1 U. S" g: t% e+ h6 s( h: D当然了,你也可以选择不做缩减。这种称为444采样,或者yuv444。YUV三个平面全是满分辨率。# G3 ?( p: `' r$ h
% I8 z, V: \" ~' ^# E
6、空间上的低频与高频:平面,纹理和线条/ V- \3 V) h) o( q
在视频处理中,空间(spatial)的概念指的是一帧图片以内(你可以认为就是一张图所呈现的二维空间/平面)。跟时间(temporal)相对;时间的概念就强调帧与帧之间的变换。8 C1 G4 l. e' v7 W
3 D- `8 P# C; `7 ]
7、时间上的低频与高频:动态
- ]2 Q9 w: m8 n1 @$ ~ R在视频处理中,时间(temporal)的概念强调帧与帧之间的变换。跟空间(spatial)相对。9 l# j5 N9 s9 F* _. K- f
动态的概念无需多解释;就是帧与帧之间图像变化的强弱,变化频率的高低。一段视频如果动态很高,变化剧烈,我们称为时间复杂度较高,时域上的高频信息多。否则如果视频本身舒缓多静态,我们称为时间复杂度低,时域上的低频信息多。$ R2 e: K- i& M3 a
5 D% |& Y8 o6 g0 K" c+ l% ?5 _8、清晰度与画质简述, X) W) h: U$ V. t; I: z
6 T0 _7 R9 \% \我们经常讨论,一个视频清晰度如何,画质好不好。但是如何给这两个术语做定义呢?
% g( k! w2 c0 k* m
1 W8 G0 Q; w; i( s2 i' i( D经常看到的说法:“这个视频清晰度是1080p的”。其实看过上文你就应该知道,1080p只是视频的分辨率,它不能直接代表清晰度——比如说,我可以把一个480p的dvd视频拉升到1080p,那又怎样呢?它的清晰度难道就提高了么?
. U# K+ @* y& x# G) ^所以清晰度的定义我更倾向于这样一个说法:图像或视频中,原生、有效的高频信息。& e( d0 G( Y( ], `
原生,强调这种清晰度是非人工添加的;有效;强调细节本身有意义,而不是毫无意义的噪点特效。
% o8 G" _* {% y) \$ I$ H视频的画质,是由以下几点共同决定的:
! p, `& ~8 J% x; u3 }' R# |3 K
& V* _. k3 [8 i" o$ I) U/ q1、源的画质。
2 e# M5 d8 r; N# }+ K: z俗话说的好,上梁不正下梁歪。如果源的画质本身很差,那么再如何折腾都别指望画质好到哪去。所以压制者往往会选择更好的源进行压制——举个栗子,BDRip一般都比TVRip来的好,哪怕是720p。蓝光也分销售地区,一般日本销售的日版,画质上比美版、台版、港版啥的都来得好,所以同样是BDRip,选取更好的源,就能做到画质上优先一步。# [: e8 r# k& I8 Q/ Z' B
5 G/ T2 ?: J# ?$ ^& G( t: F
2、播放条件。
8 k# G5 F* K9 O观众是否用了足矣支持高画质播放的硬件和软件。这就是为啥我们在发布Rip的同时大力普及好的播放器;有时候一个好的播放器胜过多少在制作方面的精力投入。# ]8 {$ ? E1 {( [
5 h" q/ M7 D* D% K* n8 C
3、码率投入vs编码复杂度。! h, [$ k9 h# F" U
视频的时间和空间复杂度,并称为编码复杂度。编码复杂度高的视频,往往细节多,动态高(比如《魔法少女小圆剧场版 叛逆的物语》),这样的视频天生需要较高的码率去维持一个优秀的观看效果。( l7 ?( b! R4 w1 d" X
相反,有些视频编码复杂度低(比如《请问今天要来点兔子么》,动态少,线条细节柔和),这种视频就是比较节省码率的。
' C/ p: O/ z7 ~3 [$ r! T
& P" ~) _! C V. d8 a4、码率分配的效率和合理度。4 U" s% n5 R! I* D
同样多的码率,能起到怎样好的效果,被称为效率。比如H264就比之前的RealVideo效率高;10bit比8bit效率高;编码器先进,参数设置的比较合理,编码器各种高端参数全开(通常以编码时间作为代价),码率效率就高。: c# y% K: l0 a; G
合理度就是码率在时空分配方面合理与否,合理的分配,给观众的观看效果就比较统一协调。 码率分配的效率和合理度,是对制作者的要求,要求制作者对片源分析,参数设置有比较到位的理解。
/ y& w/ t* q. Z* F8 N码率分配和合理度做的好,就常常能做出低码率高画质的良心作品。4 [0 d, G. b3 R3 h- _
5、编码前的预处理。预处理分三种:) B( J$ G" n. _
①,客观修复。强调修复片源固有的瑕疵,比如锯齿,色带,晕轮等等。
8 `( _: _+ D+ b9 F1 |- t' K. P5 i8 M②,主观调整,强调将片源调整的更适合人眼观看,比如适度的锐化,调色(有时候你是可以通过科学方法判定片源的颜色有问题,然后针对的做修复的)。
4 Y9 | q* n' [6 z% ]$ W, X$ P& [ Z③,移除无效高频信息,比如降噪,避免码率浪费在无效的噪点上
; j+ X/ X# T1 \$ S预处理做的好,往往能达到画质上超越片源,或是在几乎不牺牲清晰度的前提下,节省码率开销。1 E1 E4 H. |, j: n f: i1 p
但是预处理是一把双刃剑,优化的同时,可能引入副效果。降噪、抗锯齿、去晕轮等操作会不可避免的损失一些有效细节(或多或少,取决于制作者水准);主观调整很可能会引入副效果(比如过度锐化会导致锯齿和晕轮),或是变成了作者的自我满足,形成对观众的欺骗。
, I; P' x: h ]1 g
# I9 W; i* E" |( m综上,一个优秀的画质,是由片源、制作者、观看者共同决定的;码率高低也只是部分因素,并非决定性的效果。 |
|
|
|
|