第三章数字声频记录技术
2.1数字录音带
数字录音带是一种可以大规模生产的数字声频记录介质。在DAT格式中,利用螺旋扫描带存储器来记录和重放声频信号,其支持3种采样频率,即32kHz、44.1kHz和48kHz,在某些模式下,也支持96kHz的采样频率。因为DAT记录器具有数字信号输入和输出端口,所以可以将两台记录器互连,实现高质量的磁带复制,且子码信息也跟随数字声频数据传输。数字声频磁带易于获得很宽的信号动态范围、很小的畸变和很高的信噪比,特别是数字信号具有灵活的变换与处理特性和极高的复制特性,使其明显地优于模拟记录方式。
2.1.1DAT盒式磁带的构造
对于DAT记录格式,专门设计有DAT盒式磁带,并对其进行了标准化。盒式磁带的尺寸为73mm×54mm×10.5mm,如图2-1所示,比半个模拟录音带稍大一点。磁带宽度为3.82mm,与模拟C-90磁带厚度相等。在一个大约60m的长度上,DAT可录制2h的声音。通过减缓磁带速度、降低采样频率、减小轮盘直径或者使用更薄的磁带,记录时间可长达4~6h。磁带介质是一种具有高矫顽力的金属氧化物微粒。
DAT磁带盒用以保护内部磁带。只有当一盒磁带被放入DAT录音机后,滑板才收缩,露出磁带的轮毂,保护罩才打开,允许对磁带进行操作。如图2-2所示,磁带导架牵引出磁带,并将磁带卷绕在旋转磁鼓上。一个磁带盒内部的轮闸机构保证磁带的松弛度最小。另外,还提供光学检测的措施,利用透射光或反射光来确定磁带的末端。前者的方法是使光折射通过磁带盒的顶角,后者是利用放置在磁带盒中透明窗口上的棱镜体来实现。
在DAT的标准位置上都有4个识别孔,用来帮助录音机确认磁带类型。前面的3个孔组成一个编码,标志不同厚度和磁道间距的4种状态。孔1、2、3构成下列编码:到磁带盒的边缘。另外两个朝向磁带中心的基准孔用于磁带位置的校准。磁带顶部的一个槽口用来作为装载夹使用。
2.1.2DAT模式的分类与特点
表2-1中总结了DAT的4种记录/重放。标准模式可提供16bit的线性数字转换和44.1kHz或48kHz的采样频率。绝大多数客户的DAT录音机同时有模拟和数字输入和输出。录音机中包含一个SCMS电路,当任何数字源的比特流中的禁止复制标识处于工作状态时,它可以防止复制磁带。
其他3种记录/重放模式使用32kHz的采样频率,分别称为选项1、选项2、选项3。选项1提供16bit的线性数字转换下的2h记录时间;选项2提供12bit非线性数字转换下的4h记录时间,磁带的线速度和磁鼓的转速减半;选项3同样使用12bit的非线性数字转换,提供四通道的记录和重放功能。某些厂商的DAT录音机工作在96kHz的采样频率下,使磁带速度加倍,记录时间减半;另一种改进型录音机的采样频率为48kHz,可进行24bit记录。这两种录音机与传统的DAT录音机都不兼容。
2.1.3DAT硬件设计的基本方案
DAT技术同样借鉴了旋转磁头视频技术和CD技术。要在磁带上记录大量的数据,必须应用大量精密的记录技术来提高记录性能。另外,子码覆盖等用户特性要求数据记录具有灵活性。在任何数字声频系统中,调制码和纠错在决定系统性能中均具有重要地位。
在DAT录音机中使用的许多硬件与CD机一样,但增加了一些编码电路。其主要硬件单元如图2-3所示,包括A/D和D/A转换器、调制解调器、纠错编码器和解码器。声频信号以数字形式输入,模拟声频信号通过A/D转换器转换为数字形式,同时还实现了纠错编码和交织功能。如同任何一个螺旋扫描系统一样,在记录之前,必须通过时域压缩把输入的声频信号分割成离散的段:重放时,再用时域扩展把这些离散段结合起来,形成连续声频输出信号。记录用的输出缓存时钟频率高于数据输入的时钟频率,以满足时域压缩的需要。比特流中加入了子码信息,并将数据从并行形式转换为串行形式。数字信号经过8-10调制编码后,通过记录放大器、旋转变压器和旋转磁头等记录到磁带上。
在重放时,通过磁头和磁带的移动,将信号导入磁头,激励出所记录的波形。磁道寻迹信号从磁带上被读出,用来自动调整磁道。8-10调制编码将数据重新转成并行的比特流形式。子码数据分离出来以后,用于操作系统和伺服控制。寄存器允许执行和解交织时域扩展,并用来消除速度不均匀性。解交织在纠错操作后进行。最后,声频信号以数字信号的形式输出,或者通过D/A转换器转换成模拟信号。
DAT所能达到的数据密度是很高的。每个磁道的数据位占据0.67μm,总的数据记录密度为17.7Mbit/cm2。在48kHz采样频率和16bit数字转换下,声频数据速率是1.Mbit/s。纠错编码在原始信息量上增加了大约37.5%,使数据速率达到2.46Mbit/s。最后,加上子码使整个数据速率增加到2.77Mbit/s。
旋转磁头在获得较高的记录带宽的同时,允许较低的磁带线速度。磁带通过一个同方向高速旋转的带有倾角的磁鼓,其每个磁道的记录都是不连续的。一个30mm转速为2r/min的DAT磁鼓具有2个分开°的磁头或4个分开90°的磁头,其中4个磁头可同时对偏离磁带进行检测。磁带与一个30mm磁鼓的缠绕角为90°。从图2-4所示的物理结构关系可以看出,记录/重放信号只占50%的时间,而另外50%的时间是间断的。这样的磁头间隙同样用于记录和重放。
从旋转磁头输出的射频在时间轴上被压缩到原来的1/3,达到7.5Mbit/s的速率。这个过程允许不连续记录,易于使用小直径的磁鼓和小尺寸的旋转变压器,并提高磁头的信噪比。
通常磁鼓直径为30mm,也可采用其他直径的磁鼓。如15mm的小直径磁鼓用于便携式DAT录音机。使用60mm直径的专业磁鼓时,磁带卷绕角度只有45°,易于提高磁带速度,实现高速存取。不同直径的磁头产生的磁道长度是相等的,这确保了兼容性。
磁带的机械运转系统如图2-5所示。两个辊轮导轨均稍向前倾斜,并低于磁带通过的路径,以维持磁带在旋转磁鼓作用下的高度。进口和退口倾斜导轨把磁带放置在平行于磁鼓表面的位置。跟踪的稳定性优于录像系统中的M型卷绕和W型卷绕。这种较少的接触减小了磁带和磁头的磨损,允许在磁头和磁鼓接触时的高速转带和查找。另外,磁头寿命在磁带张力低的情况下能够得到延长。尽管磁带的速度只有8.15mm/s,却可以得到3m/s的相对速度,这就使得在一盘带子上记录2.2GB信息成为可能。
2.1.4磁道上的记录格式
如图2-6所示,用旋转磁头记录的结果可产生对角形式的磁道,与水平线大约成6.5°。每个磁道的宽度是13.μm,长度为23.mm。螺旋扫描磁道对用来记录数据,每个磁头对应一个磁道。除了磁道外,磁带的两边有两个额外的垂直区域并不记录信号,因为磁带的边缘容易受到损伤。每个螺旋磁道分成一系列的数据域。PCM声频数据记录在每个磁道的中间,构成磁道上数据的主体。子码和ATF占据了磁道的重要区域。
在图2-7中显示了DAT磁道格式。每个磁道包含16个域,共分个声频块。在磁道中央个块记录声频数据。子码数据被写入两个域中信号确保对旧磁道的覆盖,以防止数据区域之间的相互干扰。当新数据覆盖旧数据时,数据区域的重写与IBG定位保持一致。另外,定时可以由ATF信号得到,以得到精确的记录。
2.1.5DAT的方位记录与自动磁道跟踪
1.方位记录
DAT数据磁道的录制方法是方位记录,有时指无保护带记录或锯齿形记录。利用方位记录,磁道可以一个接一个无间隔地进行记录而不留缝隙。这不仅增加了记录密度,而且读磁头的缝隙可以宽于记录磁道,在连续记录的磁道中具有±20°的方位角。这个方位角意味着当A磁头读取A磁道时,相邻的B磁道的强度由于相位不同而有很大衰减,从而减弱了相邻磁道间的交互干扰。
相邻磁道的信号可用于自动磁道跟踪。±20°的方位角使得交互干扰比磁带噪声低了一个数量级,而信号电平只减弱了1dB。磁带速度也变慢了,而且跟踪磁道的容错性也增强了。因为当某个磁道的交互干扰增大时,相对磁道的交互干扰就会减小。
消磁是简单地在向磁带中写入新数据时自动实现的。通过降低磁带相对于磁鼓角速度的线速度,可以连续地在先前的部分磁道中写入数据。这样,磁头缝隙多了50%,结果方位记录降低了相邻磁道的交互干扰,实现了自动磁道跟踪。
2.自动磁道跟踪
为了实现磁道跟踪,以得到高质量的重放信号,可用一套复杂的跟踪纠错系统。因为每个扫描磁道包括两个由自动磁道跟踪脉冲串信号组成的脉冲串,使之在相邻磁道上的ATF信号互用成为可能,亦即A磁头可以利用相邻的B磁道上ATF信号来跟踪一个A磁道,B磁头也可利用A磁道上的ATF信号来跟踪一个B磁道。
如图2-8所示,ATF使用.67kHz作为IBG擦除信号。当每个磁道被读取时,依据f2或f3同步信号的定时,相邻磁道的ATF可以被探测到。导频信号占据A磁道的前端和B磁道的后端。另外,ATF模式每隔4个磁道就出现重复,相互间的差异只是定时上的不同,以此来防止磁头跟踪错误的磁道。磁头对整个磁道宽度进行扫描,然后在相邻磁道上读取导频信号f1的一小部分。对于随后的磁头,由于相邻磁道上的导频信号并不是同时的,所以信号有延迟,以便于比较。
2.1.68-10调制码记录方式
DAT格式中使用了8-10调制码,这在方位记录系统中是有效操作。因为采用低频方位记录时不能将交互干扰衰减得足够小,所以设计了8-10调制码,以消除直流分量,并普遍地降低低频分量。另外,由于磁带消磁是在短波长下得到优化,为了帮助磁带的记录覆盖,8-10调制码通过限制最大的运行波长,提供了最短波长和最长波长之间的一个较小的比率。最后,8-10调制码支持高的数据记录密度。在这种编码中应用了转换机制,使得8bit的信息字转换成10bit的通道字。
理想的8-10调制码不含纯直流分量,在调制后的波形中,高、低振幅具有同样的持续时间。然而,没有足够数量的10bit通道字可以用来表示编码8bit输入数据所需的种状态,而且,在给定最长的运行波长限制后,只有个通道码满足两者的需要。因此个密语必须有直流分量,或者是非零的数字累积值。DSV用来指示直流成分。DSV记录了在NRZI编码下,高振幅通道位周期和低振幅通道位周期之间的比值。个非零DSV密语中,每一个都定义了两种模式,一个具有+2DSV,另一个具有-2DSV。为了得到这样的模式而反转了第一个通道位。这两种模式的选择是基于累积的DSV。例如,如果DSV在负数范围中变动,则选择+2的字,以趋向于零直流状态。表2-2给出一部分8-10调制码的查找表,以及一个不需要替换的密语和一个需要替换的密语。图2-9所示为DSV由NRZI信号的极性确定。
为了便于转换,8-10调制码的关系式使用计算机优化,一个程式化的逻辑数组实时地产生8-10调制码。因为DSV不需要计算,所以编码过程相对来说容易实现。8-10编码中一个单通道位的错误可以产生另一个合理的通道字,这增加了对纠错的需要。8-10调制码允许相邻通道为1,而在1状态之间,不允许存在多于3个通道为0状态。
2.1.7DAT的纠错编码
在记录、重放和搜索过程中,磁带是与旋转磁头相接触的,磁带的磨损引起信息脱落,需要采取比较复杂的纠错措施。纠错的设计主要是针对纠正随机错误和突发性错误。前者由相邻磁道的交互干扰、不完全跟踪或者磁带拉力的不稳定性造成,后者是由尘埃、磁带上的擦痕或者污垢使磁头阻塞而引起的信息丢失。DAT的纠错必须允许编辑,因此数据不能在许多磁道之间交织,而且必须限制在一对磁道之间。这样,记录新的数据时可以抹掉原有的数据。DAT格式需要一个大的数据缓存,以便于实现旋转磁头存储所需要的时域压缩,并在消除跳动的同时完成交织。
DAT格式是假定的符号错误率是10-5所示。同样,当一个磁带缺陷在两个通道中引起信息丢失时,也只有偶样本或者奇样本会同时损失。48kHz、44.1kHz和32kHz采样频率的交织如图2-11所示。
所有数据都是在双重编码RS纠错码下编码,该纠错码基于使用多项式x8+x4+x3+x2+1的伽罗瓦域。内码C1是一个最小距离为5的RS码,并在逆交叉存储之前将错误消除。这样,突发性的错误可以被检测到,并被标识。经过逆交叉存储之后,突发性错误则被分散,因而更容易得到纠正。
2.1.8DAT的时间码
SMPTE/EBU时间码在诸如电影、录像和放映、声音柔化、需要信号同步的CD预读取等应用中都很重要。在最初的用户DAT标准设计中并不支持时间码。SMPTE时间码信号能以2.4kbit/s的数据速率编码。然而,在保持与现存DAT标准兼容的前提下,加入时间码很困难,因为SMPTE/EBU时间码的时钟与任何一种DAT记录格式都没有整数倍的关系。
DAT磁带格式在两个外部磁带边缘都有可选择的纵向磁道。但是,在慢的磁带线速度下记录完整的时间码很困难,而且对短的录制波长以及记录和回放间的一致性要求很高,而对于静止的记录/重放磁头之间必须对齐的要求也极为苛刻。
DAT在记录中磁道以数据块的形式记录,每个数据块包含个通道位。一个磁道包含个数据块,其中的16个数据块属于子码。子码ID分成两个区域,每个区域有8个数据块。加上ID标识如跳转ID和开始ID,将子码数据分为7种不同的包。每个包有64bit,可用于不同的用途。例如,在用户DAT标准中,一些包中有持续增加的运行时间。其他的包,包含程序时间、绝对时间、TOC、分类数、ISRC等。有16种可能的包,但是在任何一个双数据块中,最多只能记录7种包。
在前DAT格式中,将用户运行时间。ProR-Time以33.33Hz的频率记录在与R-Time相同的结构中,称为ProR-Time包。11bit的时间码标志小时、分、秒和帧,如图2-12所示。SPI0/SPI1标志IEC时间码、AES3采样地址码或者AES3日期码,F1/F0标志输入采样频率,T2/T1/T0显示原始时间码的比率。前运行时间在回放时转换成运行时间。除了帧数目转换外,要保持DAT帧边缘和输入的时间码帧边缘之间的绝对相位关系。差别是以采样的数目来表示的,并作为11bit时间码标识与前运行时间一起记录。这样,在重放过程中,可以重建声频和时间码之间的相位准确性。
这个系统本质上是由实时转换为实时,这虽然比较复杂,但很有益处。录制的前DAT码是唯一的。任何专业的仪器都可以读取并把它转换回SMPTE/EBU帧速率。原始的时间码帧速率可以忽略。重放的时间码帧速率可以由重放硬件来选择,通用的时间码转换方法是前DAT系统固有的特征。使用前DAT格式中定义的标准算法,不同的SMPTE/EBU时间码可以成功地转录在DAT上。在理论上,任何类型的时间码都可以转换为前DAT时间。另外,时间码和界面标准还包括辅助数据。例如,AET3界面包含通道状态数据块的信息,而SMPTE/EBU界面同样包括用户比特。前DAT标准使用一个前二进制包来记录这个数据。IEC批准了在原始R-DAT标准中这一对时间码的修改。
所有的专业录音机都与用户DAT标准兼容。尽管通常采用的是一个四磁头格式,专业的录音机使用标准的DAT螺旋扫描。在录制和配音过程中,先写后读功能提供了磁带偏移的声频监测。在编辑中,可以检测录音机或播放器。声频数据和时间码可以在集合模式中同时记录,或者在插入模式中单独记录。启动ID和程序数可以用先写后读取功能加入,能达到一帧的准确度。重放速度可以在±12.5%范围内变化。插入是在穿梭模式下使用一个搜索刻度盘,以高于或低于正常速度完成。数字的输入/输出,包括AES3、S/PDIF和SDIF-2接口。模拟连接通过平衡的XLR类型连接得到。时间码和字同步输入/输出的连接,用于外部的同步。
SMPTE/EBU时间码读取/生成器,可使得录音机能与外部图像同步信号同步工作。录音机能完成时间码的同步跟踪。在通常模式下,当接收到的时间码锁定时,重放自动开始。在穿梭模式下,录音机连续地跟踪,保持同步,而不受主时钟变化的影响。录音机可以锁定参考信号,例如SMPTE/EBU下降或非下降帧、EBU时间码和图像同步信号。当不使用图像设备时,可以通过字时钟从数字声频系统中得到同步信号。录音机可以有一个4Mbit的存储器,使录音机可以从零增长时间启动。这个直接启动特性在广播和扫描中得到应用,可以通过RS-C接口将录音机置于计算机的控制之下。
2.2DVD
光盘记录方式由于记录密度高、信号质量好,所以发展迅速,已从LD、CD、VCD逐步发展为DVD。DVD所采用的技术比所有其他数据存储媒质更能让电影制片商、程序员表达他们的创造性思维,让用户更能体会到前所未有的境界。对信息记录媒体而言,DVD在数据存储方面具有其他媒质所无法比拟的容量和灵活性。
2.2.1概述
1.DVD的标准格式
(温馨提示:全文小说可点击文末卡片阅读)
若按类别来分,DVD的标准格式共有6种,如图2-13所示。其中BookA是DVD-ROM。
每种格式又进一步分为几个部分:第一部分定义物理特性,第二部分定义文件系统,其余的部分定义各种特殊的应用和扩充。例如,第三部分定义视频应用,第四部分定义声频应用,第五部分定为VAN扩充。DVD-ROM、DVD-Video和DVD-Audio盘、ISO和ISO的有关内容。DVD-Video采用MPEG视频编码标准和杜比数字声频编码标准,DVD-Audio使用了多种声频编码标准。
2.DVD的物理参数
DVD标准的第一部分定义了DVD光盘的物理标准,DVD-ROM、DVD-Video和DVD-Audio的光盘是一样的,因此该部分适用于这3种格式。这些只读格式有着相同的光盘结构、编码、错误校验等,对mm和80mm的盘均适用。DVD盘使用凹坑结构来存储数据,轨道间距为0.74μm,单面CLV轨速为3.49m/s,双面为3.84m/s,最小凹坑长度只有0.4μm,最小/最大孔长为0.40/1.87μm。
DVD盘使用两层0.6mm厚的基片,它们压在一起,数据层夹在中间,使数据得到更好的保护。同时采用薄的基片,可以减少激光束跟踪的错误,如图2-15所示。当然,由于薄基片使数据面更靠近光盘表面,表面污染不像CD那样离聚焦很远,这就要使用更有效的纠错手段来补偿。双层结构使制造多样化,产生了4种只读光盘:DVD-5、DVD-9、DVD-10和DVD-18。当平均数据读取速度为4.8Mbit/s时,它们大致的播放时间分别为min、min、min和min。4种光盘的容量分别为4.7GB、8.5GB、9.4GB和17GB。
单层单面的DVD-5盘只有一个数据层的面和一个空面。将两个带有数据面的层压在一起形成一个双面单层的DVD-10盘,需要翻转光盘才能读到另一面。DVD标准允许在一个面中有两个层,一层贴在另一层下面形成一个只从一面读取的双层盘,这就是DVD-9。将两个双层面合在一起,即形成一个DVD-18盘。两层之间由一种纯净的树脂和一层极薄的半透明金膜和银膜分开。
3.光盘的制作
在DVD光盘制造过程中,记录激光将使用更短的波长。DVD基片较薄,在制造过程中需要精细的制造工艺。
制造双面光盘时,两层基片是独立形成的,用热熔黏合剂或紫外线-黏合剂粘在一起。也可以在单层基片涂上一层半透明物质,然后覆盖上一层光聚合物,光聚合物由第二层基片制成并用紫外线照射使其硬化,当该层硬化后,再附上一层反射材料,这时便可以与第一层黏合在一起了,如图2-17所示。该技术可用于制造另一些DVD-9盘和DVD-18盘。
2.2.2DVD-Video
DVD-Video是最早规定的DVD格式,可存储一部5.1声道的电影节目。DVD格式的设计符合StudioAdvisoryCommittee的建议,包括min的数字视频节目、接近D1的广播图片质量、立体声或多声道数字声频、不同影面比例、多至8种的语言声道、32种字幕、父母管理选项和版本保护特征。
1.视频编码
要将一部电影存储在直径只有mm的光盘中并不是轻而易举的事。为了能够存储一部电影节目,DVD-Video光盘需要有更高的存储容量和输出比特速率,以及更好的数据压缩技术。虽然DVD-Video光盘数据层容量是CD的7倍可填满整个单面单层的DVD盘。为了存储min的声频和视频节目,需要的压缩率大约为60:1。为了达到这一要求,除了采用先进的压缩算法外,还要预先对数据进行一些过滤操作。
NTSCCCIR-规定每线点、每帧线。
这些措施将比特率减小54%,当编码电影时,还可以更有效一些,电影为24帧每秒,而DVD-Video为30帧每秒,这意味着转换之后,每30帧中有6帧重复,它们不需单独编码。加起来,这种前处理使信号比特率减小63%。尽管比特率只有Mbit/s,还是需要进一步压缩,例如,将一个min的电影置于一个单层单面盘上时,平均压缩率仍需达到21:1。
MPEG-2视频压缩算法充分利用了人的视觉特性,将冗余的、不能感知的信息丢弃,不进行编码。对单独的帧以及一系列的帧之间作精确的分析,将大于95%的视频数据忽略掉,而对图像并没有明显的影响。
MPEG-2编码的一个重要方面是它变化的比特率,有些图像信息比其他的图像信息量大,因此MPEG-2允许不同的比特率。编码运动图像数据所需要的比特率在不同的场景下有很大的不同。例如编码一个在静止的背景中运动的物体,只需比较低的比特率,编码一个快速运动的场景,复杂变化的图像需要更高的比特率。
DVD-Video最大输出比特率。视频节目以4:2:0分量逐行扫描形式存储,图像分辨率为×。在MPEG-2算法设计中已经考虑到,只要稍微改变解码算法就可以与现有的解码器兼容。DVD-Video的特性如表2-3所示。
2.声频编码
DVD-Video标准的声频部分,同时提供多声道和立体声声道。DVD-Video可使用8个独立的声频数据流。它们可以是1~8个声道的线性PCM,这对光盘而言是可选的,而对播放器而言是必需的。DVD-Video光盘上最大线性PCM比特率为6.Mbit/s。当然,增加声频比特率就要减少视频比特率。
3.播放特点
DVD-Video格式最多支持32个子图像流。子图像是加在图像上的图片文件,一般用于字幕、专题或其他文字。子图像可以卷起、放入,并在不同的图像域变化。调色板有16种颜色和对比度值,每个子图像流一次可以显示4种颜色和4种对比度值。子图像数据是游程编码的每点2bit的位图,每个比特速率为10kbit/s,子图像信息可以由时间码或用户按钮得到,可以产生图片和简单的动画。
光盘和播放器中包含有地区码标记,因此用播放器只能播放具有正确地区码的光盘。例如2区的光盘,这样可以使影片制造商对全球不同市场影片的上映进行控制。盘上的地区码是可选的,播放器上也有相应的电路。光盘可以有多个地区码,或者没有地区码,没有地区码的光盘可以在所有的播放器上播放。地理区域共分6个:加拿大和美国;日本、欧洲、南非及中东;东南亚及东亚,包括中国香港地区;澳大利亚、新西兰、太平洋岛、中美洲、墨西哥、南美洲及哥伦比亚;俄罗斯、印度、非洲、朝鲜和蒙古;中国。此外,区域7保留,区域8用于国际区域。
2.2.3DVD-Audio
1.DVD-Audio格式
DVD-Audio格式定义了一种高质量声频存储格式,它可提供范围很广的声道、采样频率、字长及其他参数。尽管只是一个声频标准,它还提供了与视频及其他方面的协作。
DVD-Video格式可提供高质量声频,其最高的声频比特率为6.Mbit/s,不支持最高质量级别。而DVD-Audio格式的最高比特率为9.6Mbit/s,可提供更高的质量。当然6声道96kHz、24bit声频超过了这一最大比特率,并且使播放时间减少,因此需要选择有损和无损的压缩算法来降低比特率,增加播放时间。
DVD-Audio与其他DVD光盘格式兼容,与CD格式向后兼容,提高了声音质量,引入多声道播放。另外,DVD-Audio采用了严格的反盗版措施。为了增大容量,DVD-Audio还提供无损压缩声频数据,可在单层数据面上存储超过74min的高质量多声道音乐。所有的DVD-Audio光盘必须包含节目的一个无压缩或MLP压缩的LPCM声频版本。为了有更好的灵活性以及与现有的DVD-Audio播放器兼容,DVD-Audio光盘也可使用包括含有杜比数字、DTS或LPCM音道的视频节目。
DVD-Audio光盘有两种:一种是AudioOnly光盘,它只包含音乐信息,可以有静止图片光盘,它包含运动视频信息,其格式为DVD-Video的子集。
2.编码和声道选项
DVD-Audio格式支持多种不同的编码方法和记录参数时只能播放两个声道。另外,对不同的声道可设置不同的声频参数,如采样频率、字长等。
不同的编码选项、采样频率范围、字长、节目声道,使播放时间很不相同。另外,光盘的层数也决定了播放时间。例如,在不同的记录参数下,一个立体声LPCM节目在具有一个数据层的光盘上可能播放min或65min。与此类似,多声道记录的不同方法给出了不同的播放时间,见表2-5。MLP无损压缩使播放时间变长。MLP的压缩率取决于被编码的音乐,一般的压缩比为1.85:1,差不多能使数据传输速率减半,在不影响声频质量的情况下使播放时间加倍。有损压缩算法同样也能增加播放时间。
高采样频率如96kHz和kHz看起来似乎不必要,因为只有极少数人能听到24~26kHz的声音,远低于48~96kHz的截止频率,而大多数人听到的最高频率低于20kHz。因此,对平稳的音调,采用高采样频率的确没有什么作用。但是有人认为高采样频率可以提高双耳的时间响应,使印象更明显。例如,如果对每只耳朵施以短脉冲,可以听到15μs的时间差,这个时间差比48kHz两个采样点的时间差要小。一些人可听出5μs的时间差,这与kHz采样的两个采样点之间的时间差一致。理论上,高采样频率可提高空间印象。因此,需要使用两只耳朵分辨48kHz和kHz的两个采样记录。设计者希望DVD-Audio标准能够在保真度上有所改进,并在任何情况下,该标准不成为一个限制因素。
DVD-Audio光盘上的其他附加内容,包括艺术家名字、歌名、注释、艺术家说明、传记、视频以及因特网主页。非实时的信息记录在数据区。支持两个字符集,对欧洲语言为ISO-1,对日本语言为MusicShiftJIS,并可支持多种语言。在每一个磁道上可附加一幅静止图像,它们在播放音乐时可以产生像幻灯片一样的效果。文本和声音效果可以实时播放。其他的信息对光盘是可选项,而通用的播放器则必须能对它们解码。在一些情况下,播放器使用文本信息来构成一个文本菜单。
活动图像信号也可以作为一个独立的视频部分加入到DVD-Audio光盘中,它被定义成DVD-Video标准的一个子集。其限制条件是最多有两个声频流,其中至少有一个为LPCM,而LPCM流最多只能有6个声道,并有严格的声道指定。另外,没有多故事、多角度、父母控制或区域控制功能。在DVD-Video中,PCM声频不是必需的,必需的是杜比数字。
3.光盘上的内容分布
DVD-Audio光盘的内容分布如图2-18所示。卷描述一个盘面的全部内容。一个卷可以有9个组,一个组可以包括99个磁道,一个音轨可有99个目录。
表2-6为采用DVD-Audio格式的只记录声频的光盘结构示例。此光盘共有2个组,组1有5个磁道,组2有2个替代的磁道。另外,每个组有2个选择,磁道3、4、5可使用向下混音。在该例中,组2的#2使用可选的编码方式,每个组有一个或多个ATS,磁道即ATS内的对象。
表2-7是DVD-AudioAV光盘的一个示例结构。在这里,卷中只有一个组。它有5个只有声频的磁道和2个AV磁道。磁道1和磁道2有2个选择。例如,磁道1中#1为立体声混音,#2为多声道混音,磁道6和7含有视频成分,磁道是ATS和VTS内的对象。
DVD声频播放器类似的光盘,并将其作为一个可选格式。因此,一些播放器可同时播放DVD和SACD光盘。通用DVD播放器可播放DVD-Audio和DVD-Video光盘,规定必有的播放器功能有用户转换控制、组和磁道的选择以及磁道搜寻,可选的功能有组搜寻、目录搜寻、可视化菜单、随机播放、高亮显示。可视菜单是DVD-Video菜单标准的一个子集,用来选择组与磁道,并用于查看多种语言及其他注释与图像等静止信息。可视菜单对声频播放器是可选项,而对通用播放器是必需项。
2.3MP3
MP3是国际影视图像与声音的编码压缩标准MPEG-1的第3层最佳特性的混合算法。
2.3.1MP3播放机的特点与主要性能
MP3播放机最主要的特点是具有极高的数据压缩率,可将声频数据压缩到原来的1/10~1/12,音质基本与CD机的相似。MP3这种压缩格式最初是在互联网上被采用的,原因是经过WAV格式录制的音乐节目,下载一首歌曲需要半个多小时,而MP3播放机由于压缩比为1:10~1:12,所以下载一首歌曲只需要4~5min就可以。每分钟的MP3播放文件大小只有1MB左右,对于与普通CD片容量相同的MB的MP3音乐光盘,可以存储十几个小时的声音文件。如果采用MB的FLASH存储器,也可以存储大约60首歌曲,播放5个多小时的声音文件。
此外,采用FLASH快闪存储器的MP3随身听,由于没有体积庞大的电动机、磁头、激光读写机构等部件,所以可随心所欲地做成各种形状,使之具有极小的体积和重量、非常美观的外形,并且使用方便、便于携带、不怕震动、无机械故障等。
MP3播放机的功能主要有两种:一是播放功能,具有多种播放选择,如顺序播放、随机播放、单曲循环播放、全部循环播放等;二是录音功能,包括内置/外置传声器录音、MP3/WAV格式的数码录音转换等。除此之外,有些MP3播放机还具有某些特殊功能,如FM收音机、日记簿、电话簿、各种EQ模式等。
另外,MP3播放机都有USB接口,利用USB接口与计算机连接,可从网上下载MP3音乐或其他格式的音乐;也可以将CD片等各种音乐格式的文件转变为MP3格式的文件传送到MP3播放机中;并且可利用计算机按个人的意愿进行MP3音乐的编辑、转录、制作等。
2.3.2MP3播放机的工作原理
1.MP3播放机的编码器和解码器
MP3播放机具有1:10~1:12的声频数据压缩比,使码率下降为~kbit/s,其原因是采用了MUSICAM和ASPEC最佳特性的混合算法,根据人耳的听觉特性,去除了声音中人耳本来就听不到的声频信息和冗余,使声频数据得到了极大的压缩,并且听音的质量基本与CD机的相似。有关MUSICAM和ASPEC的编码和解码的具体算法可参考有关书籍,而在声音的音源PCM数据压缩编码中,采用的主要方法如下。
(点击上方卡片可阅读全文哦↑↑↑)
感谢大家的阅读,如果感觉小编推荐的书符合你的口味,欢迎给我们评论留言哦!
想了解更多精彩内容,
转载请注明:http://www.0431gb208.com/sjszyzl/3004.html