摘要:介绍了基于PC平台的非线性编辑系统,其视音频子系统的硬件结构,用于视音频子系统中的视频压缩技术和数据存储技术。
关键词:非线性编辑,视频压缩,数据存储
1 概论
非线性编辑这个名称是为了与传统的线性编辑相区别而产生的。传统的电子编辑方法是线性编辑。在非线性编辑系统中,视音频素材存放在盘体表面同心圆状的磁道中,磁头在二维的极坐标环境中定位和读写。对于存储在盘上的任意位置的素材,磁盘与磁头二者的联动一般用几ms就可以找到,找点时间基本上没有差别,所以称为非线性编辑。因此,通常把基于磁带的编辑系统称为“线性编辑系统”,而把基于磁盘的编辑系统称为非线性编辑系统。
由于非线性编辑系统的信息存储位置与接受信息的顺序不相关,盘上所存任何文件均可随时调用或修改,插入内容不需要重录,大大提高了编辑效率。不仅如此,更重要的是,它还具有许多线性编辑所不具有的功能,可以处理文字、图形、图像、动画等多种形式的素材,实现了完整意义上的非线性编辑,极大丰富了影视制作的手段。 常见的非编系统分为三类:
1)基于工作站平台的系统。该系统大多建立在SGI图形工作站基础上,一般图形、动画和特技功能较强,但价格昂贵,软硬件支持不充分。
2)基于MAC平台的系统。该系统在非线性编辑发展的早期应用得比较广泛,未来的发展在一定程度上受到苹果硬件平台的制约。
3)基于PC平台的系统。这类系统以Intel及其兼容芯片为核心,型号丰富,性价比高,装机量大,发展速度也非常快,是当今的主导型系统。另外,这类非线性编辑系统正在向网络化发展,大大提高了电视台内部的制作播出效率。
下面以基于PC平台的系统为例,介绍非编系统的硬件技术。
2 非编系统的硬件结构
非线性编辑系统技术的重点在于处理图像和声音信息。这两种信息具有数据量大、实时性强的特点。实时的图像和声音处理需要有高速的处理器、宽带数据传输装置、大容量的内存和外存等一系列的硬件环境支持。普通的PC机难于满足上述要求,经压缩后的视频信号要实时地传送仍很困难,因此,提高运算速度和增加带宽需要另外采取措施。这些措施包括采用数字信号处理器DSP、专门的视音频处理芯片及附加电路板,以增强数据处理能力和系统运算速度。在电视系统处于数字岛时期,帧同步机、数字特技发生器、数字切换台、字幕机、磁盘录像机和多轨DAT(数字录音磁带)技术已经相当成熟,而借助当前的超大规模集成电路技术,这些箱级的数字视频功能已可以在标准长度的板卡上实现。非线性编辑系统板卡上的硬件能直接进行视音频信号的采集、编解码、重放,甚至直接管理素材硬盘,计算机则提供GUI(图形用户界面)、字幕、网络等功能。同时,计算机本身也在迅速发展,PC机软硬件的发展已能使操作系统直接支持视音频操作。下面主要介绍非编系统的视音频子系统的硬件结构。
视音频处理子系统通常是以板卡的形式实现的。它有单通道、双通道和多通道形式。在非线性编辑中,通常应用的是双通道系统,其视音频子系统包括:外部视音频输入模块、压缩采集和解压缩重放模块、图文产生模块、二维数字特技模块、三维数字特技模块、多层叠加模块、预览输出及主输出模块。其结构如图1所示。
视频信号输入后有一路进入数字混合器,可有一路活动背景信号在数字混合器中与其他存储在硬盘中的视频文件混合。需要压缩保存的视频信号进入压缩/解压缩通道,经压缩后变为标准的视频文件,存放在硬盘中。音频信号经A/D变换后存入硬盘。使用应用程序将视音频文件从硬盘中调出,可有两路视频信号通过解压缩进入视频混合器,由视频效果控制DSP运行,对进入混合器的视频信号进行二维、三维特技变换,在混合器中完成扫换、叠化、键控等效果。当重放时,由32bit RGB & Alpha图文帧存产生的图文在混合器中作实时混合处理,完成图像和图文字幕的叠加。音频信号经数字音频处理后输出。3非编系统中应用的硬件技术视音频处理系统中的硬件之所以能够完成上述许多功能,主要在于各种硬件技术的应用。这些技术主要有:视频压缩技术、数据存储技术、数字图像处理技术和图文字幕叠加技术等。
31 视频压缩技术
在非线性编辑系统中,数字视频信号的数据量非常庞大,必须对原始信号进行必要的压缩。常见的数字视频信号的压缩方法有M-JPEG、MPEG和DV等。
311 M-JPEG压缩格式
目前非线性编辑系统绝大多数采用M-JPEG图像数据压缩标准。1992年,ISO(国际标准化组织)颁布了JPEG标准。这种算法用于压缩单帧静止图像,在非线性编辑系统中得到了充分的应用。JPEG压缩综合了DCT编码、游程编码、霍夫曼编码等算法,既可以做到无损压缩,也可以做到质量完好的有损压缩。完成JPEG算法的信号处理器在上世纪90年代发展很快,可以做到以实时的速度完成运动视频图像的压缩。这种处理法称为Motion-JPEG(M-JPEG)。在录入素材时,M-JPEG编码器对活动图像的每一帧进行实时帧内编码压缩,在编辑过程中可以随机获取和重放压缩视频的任一帧,很好地满足了精确到帧的后期编辑要求。
Motion-JPEG虽然已大量应用于非线性编辑中,但Motion-JPEG与前期广泛应用的DV及其衍生格式(DVCPRO 25、50和Digital-S等),以及后期在传输和存储领域广泛应用的MPEG-2都无法进行无缝连接。因此,在非线性编辑网络中应用的主要是DV体系和MPEG格式。
312 DV体系
1993年,包括索尼、松下、JVC以及飞利浦等几十家公司组成的国际集团联合开发了具有较好质量、统一标准的家用数字录像机格式,称为DV格式。从1996年开始,各公司纷纷推出各自的产品。DV格式的视频信号采用4∶2∶0取样、8bit量化。对于625/50制式,一帧记录576行,每行的样点数:Y为720;CR、CB各为360,且隔行传输。视频采用帧内约5∶1数据压缩,视频数据率约25Mbit/s。DV格式可记录2路(每路48kHz取样、16bit量化)或4路(32kHz取样、12bit量化)无数据压缩的数字声音信号。
DVCPRO格式是日本松下公司在家用DV格式基础上开发的一种专业数字录象机格式,用于标准清晰度电视广播制式的模式有两种,称为DVCPRO 25 模式和DVCPRO 50 模式。在DVCPRO 25 模式中,视频信号采用4∶1∶1取样、8bit量化,一帧记录576行,每行有效样点,Y为720,CR、CB各为180,数据压缩也为5∶1,视频数据率亦为25Mbit/s。在DVCPRO 50 模式中,视频信号采用4∶2∶2取样、8bit量化,一帧记录576行,每行有效样点,Y为720,CR、CB各为360,采用帧内约33∶1数据压缩,视频数据率约为50Mbit/s。DVCPRO 25模式可记录2路数字音频信号,DVCPRO 50 模式可记录4路数字音频信号,每路音频信号都为48kHz取样、16bit量化。
DVCPRO格式带盒小、磁鼓小、机芯小,这种格式的一体化摄录机体积小、重量轻,在全国各地方电视台都用得非常多。因此,在建设电视台的非线性编辑网络时,DVCPRO是非编系统硬件必须支持的数据输入和压缩格式。
313 MPEG压缩格式
MPEG是Motion Picture Expert Group(运动图像专家组)的简称。开始时,MPEG是视频压缩光盘(VCD、DVD)的压缩标准。MPEG-1是VCD的压缩标准,MPEG-2是DVD的压缩标准。现在,MPEG-2系列已经发展成为DVB(数字视频广播)和HDTV(高清晰度电视)的压缩标准。非编系统采用MPEG-2为压缩格式将给影视制作、播出带来极大方便。MPEG-2压缩格式与Motion-JPEG最大的不同在于它不仅有每帧图像的帧内压缩(JPEG方法),还增加了帧间压缩,因而能够获得比较高的压缩比。在MPEG-2中,有I帧(独立帧)、B帧(双向预测帧)和P帧(前向预测帧)三种形式。其中B帧和P帧都要通过计算才能获得完整的数据,这给精确到帧的非线性编辑带来了一定的难度。现在,基于MPEG-2的非线性编辑技术已经成熟,对于网络化的非编系统来说,采用MPEG2-IBP作为高码率的压缩格式,将会极大减少网络带宽和存储容量,对于需要高质量后期合成的片段可采用MPEG2-I格式。MPEG2-IBP与MPEG2-I帧混编在技术上也已成熟。
32 数据存储技术
由于非线性编辑要实时地完成视音频数据处理,系统的数据存储容量和传输速率也非常重要。通常单机的非编系统需应用大容量硬盘、SCSI接口技术,对于网络化的编辑,其在线存储系统还需使用RAID硬盘管理技术,以提高系统的数据传输速率。
321 大容量硬盘
硬盘的容量大小决定了它能记录多长时间的视音频节目和其他多媒体信息。以广播级PAL制电视信号为例,压缩前,1s视音频信号的总数据量约为32MB,进行3∶1压缩后,1min视音频信号的数据量约为600MB,1h视音频节目需要约36GB的硬盘容量。近年来硬盘技术发展很快,一个普通家用电脑的硬盘就可以达到40GB,通常专业使用的硬盘容量在100GB左右,因此,现有的硬盘容量完全能够满足非线性编辑的需要。
322 SCSI接口技术
数据传输率也称为“读写速率”或“传输速率”,一般以MB/s表示。它代表在单位时间内存储设备所能读写的数据量。在非线性编辑系统中,硬盘的数据传输率是最薄弱的环节。普通硬盘的转速还不能满足实时传输视音频节目的需要。为了提高数据传输率,计算机使用了SCSI接口技术。SCSI是Small Computer System Interface(小型计算机系统接口)的简称。目前SCSI总线支持32bit的数据传输,并具有多线程I/O功能,可以从多个SCSI设备中同时存取数据。这种方式明显加快了计算机的数据传输速率,如果使用两个硬盘驱动器并行读取数据,则所需文件的传输时间是原来的1/2。目前8位的SCSI 最大数据传输率为20MB/s,16位的Ultra Wide SCSI(超级宽SCSI)为40MB/s,最快的SCSI接口Ultra 320最大数据传输率能达到320MB/s。SCSI接口加上与其相配合的高速硬盘,能满足非线性编辑系统的需要。
对非线性编辑系统来说,硬盘是目前最理想的存储媒介,尤其是SCSI硬盘,其传输速率、存储容量和访问时间都优于IDE接口硬盘。SCSI的扩充能力也比IDE接口强。增强型IDE接口最多可驱动4个硬盘,SCSI-Ⅰ规范支持7个外部设备,而SCSI-Ⅱ一般可连接15个设备,Ultra 2以上的SCSI可连接31个设备。
323 RAID管理技术
网络化的编辑对非编系统的数据传输速率提出了更高的要求。处于网络中心的在线存储系统通常由许多硬盘组成硬盘阵列。系统要同时传送几十路甚至上百路的视音频数据就需要应用RAID管理电路。该电路把每一个字节中的位元分配给几个硬盘同时读写,提高了速度,整体上等效于一个高速硬盘。这种RAID管理方式不占用计算机的CPU资源,也与计算机的操作系统无关,传输速率可以做到100Mbit/s以上,并且安全性能较高。
33 图像处理技术
在非线性编辑系统中,我们可以制作丰富多采的“数字视频特技”(Digital Video Effects,DVE)效果。数字视频特技有硬件和软件两种实现方式。软件方式以帧或场为单位,经计算机的中央处理器(CPU)运算获得结果。这种方式能够实现的特技种类较多,成本低,但速度受CPU运算速度的限制。硬件方式制作数字特技采用专门的运算芯片,每种特技都有大量的参数可以设定和调整。在质量要求较高的非编系统中,数字特技是由硬件或软件协助硬件完成的,一般能实现部分特技的实时生成。
电视节目镜头的组接可分为混合、扫换(划像)、键控、切换4大类。多层数字图像的合成实际上是图像的代数运算的一种。它在非线性编辑系统中的应用有两大类,即全画面合成与区域选择合成。在电视节目后期制作中,前者称为“叠化”,后者在视频特技中用于“扫换”和“抠像”。多层画面合成中的层是随着新型数字切换台的出现而引入的。视频信号经数字化后在帧存储器中进行处理才能使层得到实现。所谓的层实际上就是帧存,所有的处理包括划像、色键、亮键、多层淡化叠显等数字处理都是在帧存中进行的。数字视频混合器是非线性编辑系统中多层画面叠显的核心装置,主要提供叠化、淡入淡出、扫换和键控合成等功能。
随着通用和专用处理器速度的提高,图像处理技术和特级算法的改进,以及MMX(Multimedia Extensions,多媒体扩展)技术的应用,许多软件特技可以做到实时或准实时。随着由先进的DSP技术和硬件图像处理技术所设计的特技加速卡的出现,软件特技处理时间加快了8~20倍。软件数字特技由于特级效果丰富、灵活、可扩展性强,更能发挥制作人员的创意,因此,在图像处理中的应用越来越多。
34 图文字幕叠加技术
字幕是编辑中不可缺少的一部分。在传统的电视节目制作中,字幕总是叠加在图像的最上一层。字母机是串接在系统最后一级上的。在非线性编辑中,插入字幕有硬件和软件两种方式。软件字幕是利用作图软件的原理把字幕作为图形键处理,生成带Alpha键的位图文件,将其调入编辑轨对某一层图像进行抠像贴图,完成字幕功能。
硬件字幕的硬件构成通常由一个图形加速器和一个图文帧存组成。图形加速器主要用于对单个像素、专用像素和像素组等图形部件的管理,它具有绘制线段、圆弧和显示模块等高层次图形功能,因而明显减轻了由于大量的图形管理给CPU带来的压力。图形加速器的效率和功能直接影响图文字幕的速度和效果。叠加字幕的过程是将汉字从硬盘的字库中调到计算机内存中,以线性地址写入图文帧存,经属性描述后输出到视频混合器的下游键中,将视频图像合成后输出。
4 结束语
非线性编辑技术的发展经历了20多年的时间。近年来数字电视技术和电脑多媒体技术的高速发展,硬件技术的日趋成熟,使非线性编辑在影视制作中的应用越来越多。随着设备的不断小型化,相信这种高质量、高效率的影视制作手段将得到更加广泛普及的应用。
作者:广东电视台新闻中心综合组 钟国旺 文章来源:沈阳党建
(DVOL本文转自:中国DV传媒 http://www.dvol.cn)