视频基础知识/4K视频解释
视频封装/格式
常见的封装格式:MP4/MKV....
MP4/MKV是你下载的视频文件最常见的种类(文件后缀是.mp4/.mkv)。这些文件其实类似一个包裹,它的后缀则是包裹的包装方式。这些包裹里面,包含了视频(只有图像),音频(只有声音),字幕等。当播放器在播放的时候,首先对这个包裹进行拆包(专业术语叫做分离/splitting),把其中的视频、音频等拿出来,再进行播放。
既然它们只是一个包裹,就意味着这个后缀不能保证里面的东西是啥,也不能保证到底有多少东西。
包裹里面的每一件物品,我们称之为轨道(track),一般有这么些:
- 视频(Video): 一般来说肯定都有,但是也有例外,比如mka格式的外挂音轨,其实就是没视频的mkv。注意我们说到视频的时候,是不包括声音的。
- 音频(audio):一般来说也肯定有,但是有些情况是静音的,就没必要带了。
- 字幕(Subtitles):有些时候文件自带字幕,并且字幕并非是直接整合于视频的硬字幕,那么就是一起被打包在封装容器中。
- 章节(Chapter): 蓝光原盘中自带的分段信息。如果文件带上了,那么你可以在播放器中看到带章节的效果:(.potplayer右键画面,选项-播放-在进度条上显示书签/章节标记 | .mpc-hc 右键画面,选项-调节-在进度条显示章节标记)
其他可能还有附件等,不一一列举。每个类型也不一定只有一条轨道,比如经常见到带多音轨的MKV。每个轨道,都有自己的格式。比如大家常说的,视频是格式H.264,音频格式是AAC,这些就是每个轨道的格式。
MP4和MKV封装格式区别
- MKV支持封装FLAC作为音频,MP4则不支持。但是MP4也可以封装无损音轨(比如说ALAC,虽然普遍认为ALAC的效率不如FLAC优秀)
- MKV支持封装ASS/SSA格式的字幕,MP4则不支持。一般字幕组制作的字幕是ASS格式,所以内封字幕多见于MKV格式
- MP4作为工业标准,在视频编辑软件和播放设备上的兼容性一般好于MKV。这也是vcb-s那些为移动设备优化的视频基本上选择MP4封装的原因。
除此之外,这两个格式很大程度上可以互相代替。比如它们都支持封装AVC和HEVC,包括8bit/10bit的精度。所以MP4画质不如MKV好,这种论断是非常无知的——它们完全可以封装一样的视频。
为什么会有这样的分歧,就是历史原因了。MKV是民间研发,为了代替古老的AVI,从而更好地支持H264,它开发和修改的灵活度使得它可以兼容flac/ass这类非工业标准的格式;而MP4则是出生豪门,作为工业标准,替代更古老的MPG,作为新一代视频/音频封装服务的。
视频
视频的基础参数:分辨率,帧率和码率。
视频是由连续的图像构成的。每一张图像,我们称为一帧(frame)。图像则是由像素(pixel)构成的。一张图像有多少像素,称为这个图像的分辨率。比如说1920×1080的图像,说明它是由横纵1920×1080个像素点构成。视频的分辨率就是每一帧图像的分辨率。
一个视频,每一秒由多少图像构成,称为这个视频的帧率(frame-rate)。常见的帧率有24000/1001=23.976, 30000/1001=29.970, 60000/1001=59.940, 25.000, 50.000等等。这个数字是一秒钟内闪过的图像的数量。比如23.976,就是1001秒内,有24000张图像。视频的帧率是可以是恒定的(cfr, Const Frame-Rate),也可以是变化的(vfr, Variable Frame-Rate)
码率的定义是视频文件体积除以时间。单位一般是Kbps(Kbit/s)或者Mbps(Mbit/s)。注意1B(Byte)=8b(bit)。所以一个24分钟,900MB的视频:
体积:900MB = 900MByte = 7200Mbit
时间:24min = 1440s
码率:7200/1440 = 5000 Kbps = 5Mbps
当视频文件的时间基本相同的时候(比如现在一集番大概是24分钟),码率和体积基本上是等价的,都是用来描述视频大小的参数。长度分辨率都相同的文件,体积不同,实际上就是码率不同。
码率也可以解读为单位时间内,用来记录视频的数据总量。码率越高的视频,意味着用来记录视频的数据量越多,潜在的解读就是视频可以拥有更好的质量。(注意,仅仅是潜在,后文我们会分析为什么高码率不一定等于高画质)
色深(bit-depth)
色深(bit-depth),就是我们通常说的8bit和10bit,是指每个通道的精度。8bit就是每个通道用一个8bit整数(0~255)代表,10bit就是用10bit整数(0~1023)来显示。16bit则是0~65535
(注意,上文的表述是不严谨的,视频在编码的时候,并非一定能用到0~255的所有范围,而是可能有所保留,只用到一部分,比如16~235。这我们就不详细展开了)
你的显示器是8bit的,代表它能显示RGB每个通道0~255所有强度。但是视频的色深是YUV的色深,播放的时候,YUV需要通过计算转换到RGB。因此,10bit的高精度是间接的,它使得运算过程中精度增加,以让最后的颜色更细腻。
如何理解8bit显示器,播放10bit是有必要的呢:
一个圆的半径是12.33m, 求它的面积,保留两位小数。
半径的精度给定两位小数,结果也要求两位小数,那么圆周率精度需要给多高呢?也只要两位小数么?
取pi=3.14, 面积算出来是477.37平方米
取pi=3.1416,面积算出来是477.61平方米
取pi精度足够高,面积算出来是477.61平方米。所以取pi=3.1416是足够的,但是3.14就不够了。
换言之,即便最终输出的精度要求较低,也不意味着参与运算的数字,以及运算过程,可以保持较低的精度。在最终输出是8bit RGB的前提下,10bit YUV比起8bit YUV依旧具有精度优势的原因就在这里。事实上,8bit YUV转换后,覆盖的精度大概相当于8bit RGB的26%,而10bit转换后的精度大约可以覆盖97%——你想让你家8bit显示器发挥97%的细腻度么?看10bit吧。
HDR 类型
- SDR :这个是相对HDR 的8bit色彩
- HDR10:基础标准,使用静态元数据,支持10-bit色彩和最高1000尼特亮度,广泛应用于电视和流媒体。
- Dolby Vision / DV:动态元数据,逐帧优化,支持12-bit色彩和最高10,000尼特亮度,画质更优,但兼容性低于HDR10。
- HLG(Hybrid Log-Gamma):兼容SDR设备,常用于广播电视。
- HDR10+:三星主导的动态元数据标准,免费开放,对标Dolby Vision。
HDR10和HLG都是静态HDR,整部视频的每一帧都套用同样的参数;
而杜比视界和HDR10+都是更高级的动态HDR,每一帧画面都可以有单独的参数;
4K电影来源分类
- BDISO(蓝光原盘): 这是接近原版的版本,画质和音质都是佳的,包含所有花絮、字幕、导航菜单等,但文件体积也大,一部电影动辄几十GB,需要专业的播放器才能播放,更适合追求极致影音体验的发烧友。(标题中会包含“BDISO”、“Blu-ray 4K”、“原盘”等关键词。)
- BDREMUX(Remux): 可以理解为精简版的蓝光原盘,保留了主要的视频和音轨,删除了花絮、菜单等,文件体积比原盘小很多,画质和音质无损,是观影的首选。(标题中会包含“REMUX”、“4K Remux”等关键词。)
- WEB-DL / WEBRip: 这类版本来自网络流媒体平台,画质相比蓝光原盘有所损失,但文件体积小,更新速度快,适合着急想看新片的朋友,或者只在小屏设备上观看的用户。(标题中会包含“WEB-DL”、“WEBRip”、“流媒体版”等关键词。)
- BDRIP: 通过压缩技术将蓝光原盘压缩成更小的文件体积,画质和音质有所损失,但相比WEB-DL等版本要更好,适合追求画质和存储空间平衡的用户。(标题中会包含“BDRip”、“x265”、“HEVC”等关键词。)
视频格式
常见视频格式
- H.264 8bit
- H.264 10bit
- H.265 8bit
- H.265 10bit
- RealVideo (常见于早期的rm/rmvb)
- VC-1(微软主导的,常见于wmv)
额外称呼
- H.264=AVC=AVC1
- H.265=HEVC
音频
音频格式
常见音频格式
无损系列格式
- FLAC
- ALAC
- TrueHD
- DTS-HD MA
有损系列格式
- MP3
- AAC -- AAC(Advanced Audio Coding),中文名:高级音频编码,出现于1997年,基于MPEG-2的音频编码技术。由Fraunhofer IIS、杜比实验室、AT&T、Sony等公司共同开发,目的是取代MP3格式。
- AC3 -- AC3(全称Audio Coding3音频编码3)是杜比数码的同义词,杜比数码是一种高级音频压缩技术,它最多可以对6个比特率最高为448kbps的单独声道进行编码。
- E-AC-3/E-AC3/DDP -- 针对高清电视HD DVDRip的一种音轨 .就是Dolby Digital 2.0(杜比2.0).DD+、E-AC-3 、EC3三个说的是同一种格式,由于E-AC-3的音频文件后缀为.ec3,所以也有人成为EC3格式。EAC3,全称Enhanced AC-3 bit streams,与AC3类似,但不能后向兼容。AC3的decoder不能解EAC3的bitstream,EAC3的decoder即能解AC3,也能解EAC3。
- DTS:(Digital Theater Systems)是一种与Dolby Digital类似的多声道音频格式,主要特点包括:高比特率: DTS通常使用更高的比特率,相对于Dolby Digital,提供的音质更高。多声道支持: 最常见的是DTS 5.1声道,但也有DTS-HD Master Audio等更高级的格式,支持7.1声道及更高质量的音频。
杜比系列介绍
- Dolby Vision :杜比Dolby Vision,中文名称:杜比视界 解释:意思是看的一种,即提高画质的技术。(一般指视频轨道支持效果)
- Dolby Atmos:杜比Dolby Atmos,中文名称:杜比全景声 解释:意思是声音,更好的音效。(一般指音频轨道支持效果)
- Dolby Audio:杜比音效 (DolbyAudio) 技术是一系列用于为影院、家庭和途中提供丰富、清晰且撼人心魄的音效的强大技术。通过为用于广播、下载、流式传输、在影院中播放或通过光盘享受的内容提供充满活力的听感体验,该技术可进一步增强娱乐的感染力。(一般指音频轨道支持效果)
文件示例
Once Upon A Bite S05 2024 50FPS 2160p WEB-DL H.265 10bit DV DDP2.0
Once Upon A Bite
- 视频名称(风味人间)
S05
第五季2024
- 上映时间50FPS
- 视频帧率2160p
- 视频解析度(4k = 3840 x2160 = 2160p)WEB-DL
- 电影来源H.265
- 视频编码格式10bit
- HDR 10bit色深DV
- 杜比视界(Dolby Vision)DDP2.0
- 杜比2.0 高清格式
https://www.syntaxspace.com/article/2505281020479324.html
评论