《数字视频和高清:算法和接口》一导读

前言

本文讲的是数字视频和高清:算法和接口一导读,自2003年年初本书第1版问世以来,视频技术不断发展,视频和计算机图形学两者进一步地“融合”(Jim Blinn称之为碰撞)。电视正在没落,而计算机技术和网络传输正高奏凯歌。如今,哪怕“TV”这个缩写也是值得怀疑的:在过去的半个世纪中,TV意味着广播,但今天大部分的视频——来自苹果的iTunes商店、Hulu、Netflix、YouTube等——都不是传统意义上的广播。在这一版中,我用SD(标清)和HD(高清)取代SDTV(标清电视)和HDTV(高清电视)。
现在,数字视频无处不在,而图P1所示的模拟扫描已过时。在这一版中,我把像素阵列提高到首要地位。第1版介绍了扫描线,而这一版改用图像行和图像列。这一版删除了微秒,改用样本计数;删除了毫伏,改用像素值。第1版中“巨大的数据容量”等已经被“相当大”或甚至“适中的数据容量”代替。

在我1996年出版的第一本书《数字视频技术介绍》和本书第1版中,我先介绍编码,然后介绍解码。从工程角度来看,这样的顺序是有道理的。然而,现在我认为这样的顺序里隐藏着一条深深的哲学裂痕。一旦节目素材准备就绪,经过解码并在演播室的参考显示器上播放,同时进行加工,也就是在下行流最终审定播出后,只有解码和显示过程才重要。为了在再次观看时显示一幅逼真的图像而进行图像数据采样和编码还算方便,但在加工时解码并显示图像数据的难度太高。如果创作人员在编码时为了达到某个美学效果而歪曲了颜色,例如,他们将黑电平提升015倍,或将色调旋转123°——经典编码方程便不再适用,但这些图像数据的修改并不是编码出错引起的,而是创作意图运用的结果。传统的观念认为编码过程是固定的,但真正重要的是解码过程才是固定的。我提倡的原则很像MPEG的原则,精确定义了解码器,而只要产生的是合法的位流,编码器被允许做任何事。这一版里我强调解码。第2章作为新的一章,概述了这一哲学观点。
视频技术涉及的领域很广。对于本书重点阐述的图像编码,尤其是视觉科学、色彩学、图像学、信号处理与视频技术之间的关系。
如果别处有关于某一章主题的延伸、权威的信息,那么该章的结尾处会有“延伸阅读”部分。
SMPTE是许多老式标准和现代标准的根源。在本书第1版和第2版相隔出版的时间里,SMPTE弃用了许多历史标准的M后缀,而给标准加上ST前缀(并列使用EG表示工程指南,以及RP表示实践建议)。本书根据新的命名引用近期的SMPTE标准。
来到2012年,我们可以肯定地说,模拟电视技术和复合电视技术已经过时。写作本书第1版时,我把精力集中在我认为不会迅速改变的事情上。然而,第1版中可能有15%或20%的内容介绍了现在会被归类为“老式”的技术,主要是模拟电视和复合电视,以及NTSC和PAL。由于对自己花了数百或数千小时写就的内容难以割舍,我虽然把这部分内容拿掉了,但却将其放在《Composite NTSC and PAL: Legacy Video Systems》书中,在wwwpoyntoncom/CNPLVS/上可免费获得。
据说一本书中每出现一个公式就会让潜在的读者减少一半。对于本书,我希望读者在计算过10个公式之后,数量下降到2-10!本书保留了部分公式,但这些公式一般对于理解概念并非必需。如果你被某个公式吓到了,可跳过它,如果你愿意计算的话,也可以稍后再回来。我希望读者能用Bringhurst建议的关于页面组成原则的数学描述的方法来看待数学公式。在其经典著作《字体风格的要素》的第8章,Bringhurst说道:“数学在此不是强加给任何人的苦差事。相反,它们在此完全是为了娱乐。它们的目的是为了愉悦那些也许是希望把事情做得更好而乐意检验自己正在做的或要做的或已做的事情的读者。那些在任何时候都更喜欢直接行动而把分析留给别人的读者,在本章中也会满足于研究图画而忽略文字。”
在写作本书时,我小心翼翼地避免引入错误。不过,尽管我和我的审稿人尽了最大的努力,但仍可能会有一些错误。就像我的前一本书一样,我将为这本书编写勘误表,并放在wwwpoyntoncom/DVAI2/中。请在此页面报告您发现的任何错误,我将努力订正它并把这归功于你!

Charles Poynton
2012年1月于多伦多

目录

第1章 光 栅 图 像
1.1幅型比概念
1.2几何
1.3图像采样
1.4数字化
1.4.1量化
1.4.2一维采样
1.4.3二维采样
1.5感知均匀性
1.6色彩
1.7亮度和色差分量
1.8数字图像的表示方法
1.9标清和高清
1.10方形采样
1.11幅型比的比较
1.12幅型比
1.13帧频
第2章 图像的采样和显示
2.1图像状态
2.2EOCF标准
2.3娱乐节目
2.4图像获取
2.5面向消费者的视频获取
2.6消费类电子显示器
第3章 线性光和感知均匀性
3.1对比
3.2对比度
3.3感知均匀性
3.4“编码100”难题和非线性图像编码
3.5线性和非线性

原文标题:数字视频和高清:算法和接口一导读

时间: 2017-09-05

《数字视频和高清:算法和接口》一导读的相关文章

《数字视频和高清:算法和接口》一3.4“编码100”难题和非线性图像编码

3.4"编码100"难题和非线性图像编码 本文讲的是数字视频和高清:算法和接口一3.4"编码100"难题和非线性图像编码,考虑8位像素值正比于照度,零值代表黑色,最大编码值255代表白色,如图3-3所示.编码100位于某个尺度的点上,这个尺度是,相邻的照度值比率是1%.由于视力的对比度阈值是1%,编码100和101的采样的区域的边界是可以看得到的. 像素值降低到小于100时,相邻代码的不同亮度的差别越来越容易感觉到:在编码20中,相邻的照度值的比率达到5%.在灰色阴

《数字视频和高清:算法和接口》一3.5线性和非线性

3.5线性和非线性 本文讲的是数字视频和高清:算法和接口一3.5线性和非线性,现代图像传感器如电荷耦合器件(CCD)和互补金属氧化物半导体(CMOS)有效地将光子转化为电子:它们产生的信号,幅度正比于强度,称为线性的.以前视频信号是通过对电压具有线性响应的模拟电路来进行处理的.当今数字信号系统通常在像素值算法上是线性响应的.这种系统经常称为是线性的.然而,如果非线性函数分开了两个领域,在一个领域的线性度就不能跨越到另一个领域.在视频中,场景照度在一个非线性光的领域,视频信号受电器信号领域的线性操

《数字视频和高清:算法和接口》一3.3感知均匀性

3.3感知均匀性 本文讲的是数字视频和高清:算法和接口一3.3感知均匀性如果一个编码值的小扰动在这个值范围内是近似等价感知的,则感知量的编码是均匀的.如果两个照度的比例小于1.01,人眼是不能区分亮度水平的--换句话说,照度差的视觉阈值大约是1%.这种对比灵敏度阈值是由一种测量模式建立的,比如图3-2所示的草图.详细的介绍将会23.3节中展开.理想情况下,像素值会被放置在沿着从参考黑色到参考白色的恰好辨识差(JND)递增的地方. 图3-2对比灵敏度测试 图3-2所示的是对比敏感度测试模式显示,在

《数字视频和高清:算法和接口》一1.8数字图像的表示方法

1.8数字图像的表示方法 静态数码图像和动态序列可用许多不同的文件.内存和流媒体格式用来传输.大多数情况下每个像素的格式都有3个分量值(来描绘附加的红.绿和蓝三种颜色分量).在消费级别的电子和商品计算中,大多数格式每个分量会有8位.在专业应用,如在视频工作室和数字影院的应用中,每个分量上有10位.12位,乃至更多位数也是正常的. 成像系统通常用于优化人类感知的其他方面,举例来说:JPEG和MPEG压缩系统利用视觉的空间频率特性进行压缩.这样的优化通常称为感知编码. 实际中,几乎全部商业成像系统都

《数字视频和高清:算法和接口》一1.1幅型比概念

1.1幅型比概念 简单地说,幅型比是指一副图像的宽度和高度的比例.电影和视频的标准的幅型比如图1.2所示.本书中所说的幅型比有时称为显示幅型比(DAR)或图片幅型比(PAR).标准清晰度(SD)电视的幅型比为4∶3. 式(1-1)是关于图像和样本的幅型比.为了给幅型比为AR的图像赋值n阶方阵采样像素,根据式(1-2),选择图像列和图像的行进行计数(分别为c和r). 电影胶片通常采用1.85∶1(由于历史原因,它被称为平面或者球面),或2.4∶1("宽银幕电影",或俗称宽银幕).很多电影

数字视频和高清:算法和接口》一1.10方形采样

1.10方形采样 在现代数字成像,包括计算.数字摄影.图形艺术.高清视频系统中,采样点(即像素)通常在水平方向和垂直方向均匀分布--它们在水平和垂直方向采样密度相同.这些系统采用方形("方形像素点")采样,它们有相同的采样幅型比(SAR).通过使用方形采样,图像的列数与图像行数的比值即为采样幅型比.这里的方形一词指的是采样的方法,并不是指图像信息均匀分布在与每个像素相关的正方形区域,一些1080i的高清压缩系统像素幅型比达到4/3或3/2.传统的成像和包括数字标清系统在内的视频系统水平

《数字视频和高清:算法和接口》一1.5感知均匀性

1.5感知均匀性 如果小扰动编码值在感知量的取值范围内是近似相等可察觉的,那么该感知量可以以感知均匀方式进行编码.考虑收音机的音量控制.如果它物理上是线性的,那么响度感知的对数性质将大部分的感知"动作"控制在取值范围的底部.相反,控制的目的是均匀感知.图17所示的为带有标准音量锥形调节器的电位器的传递函数. 音量锥形调节器在音量调节上采用感知均匀的方式 转动角映射到声压级,这样旋转旋钮10°产生一个在控制范围内的近似声音知觉增量.这是许多内建于电子系统工程中的感知考虑的例子之一(另一

《数字视频和高清:算法和接口》一1.13帧频

1.13帧频 标清广播电视一直以来使用隔行扫描方式.在480i(NTSC)系统中,规定帧频为30/1.001Hz(29.97Hz):在576i(PAL)系统中,规定帧频为25Hz.复合PAL制与NTSC制视频帧频是固定的.分量视频系统在帧频的选择上具有灵活性.但是,生产者和分频设施通常会将其锁定在一.两个帧频上,25Hz或29.97Hz对于频段的国际分配来说,帧频转换在分频设施与消费者设备处均很重要.帧频曾经以区域为基础划分,以配合现行交流(AC)电源线频率.20世纪90年代,曾致力于为高清建立

《数字视频和高清:算法和接口》一1.9标清和高清

1.9标清和高清 1995年以前,"电视"一词专指视频格式为480i(历史上表示为525/59.94,或称"NTSC")或者576i(表示成625/50,或称"PAL")的电视标准.宽屏电视,高清晰度电视(HDTV)等其他新电视系统的兴起,为电视这个术语引入了更多的不确定性.我们以前所说的电视现在应该称为标清电视(SDTV).广泛使用的视频技术正逐步将娱乐节目和传统意义上的电视分开,而应用软件又如此丰富多彩,所以我往往将"电视"