远程视频会议系统是一种让身处异地的人们通过某种传输介质实现“实时、可视、交互”的多媒体通讯技术。它可以通过现有的各种电气通讯传输媒体,将人物的静态和动态图像、语音、文字、图片等多种信息分送到各个用户的终端设备上,使得在地理上分散的用户可以共聚一处,通过图形、声音等多种方式交流信息,增加双方对内容的理解能力,使人们犹如身临其境参加在同一会场中的会议一样。现代的远程视频会议系统除了用于音视频开会外,它还能实现一些多媒体功能:
(1)资料文档的共享。例如在政府应用中,政府办公、会议、公检法部门在远程办案中,有大量的文件资料需要与会者共同讨论。在传统视频会议中,使用文档投影机将文档通过图像的方式在与会者之间共享。但是在单流模式下使用文档摄像机,文档信息与视频图像不能同时发送,限制了用户的交流。
(2)远程培训。企业内部协作需要商讨产品设计、工程方案、统计报表分析等功能,设计图纸、业务报表是会议讨论的重点,数据传输和共享功能的重要性有时甚至超过了视频功能。
(3)远程教学应用中最充分地发挥了多媒体视频通讯的优势。针对远程教育的视频通讯方案支持课件共享、交互式问答、白板讨论、课程存储、点播回放等功能。
(4)远程医疗的应用中,开放平台的多媒体视讯系统能够与医疗设备接口,实现各种医疗数据的共享。
二、 采用远程视频会议系统的优势
(1) 节约会议的经费、时间;
在我国,召开一次全国32个省市自治区的电视会议,费用仅为5万元。相同规模的会议若在宾馆召开,会议费用将高达100万元。据统计,日本、美国之间开通1小时的国际电视会议,双方总资费不超过50万日元,并能允许10多人直接参会,通过数据流、投影等可以让所有员工旁听。但50万日元远远不能支付1个人的出差费用。据相关资料,各级管理机构的工作人员每年参加会议的时间约占全部工作时间的30%以上;每年用于公务出差的费用高达300亿元,而每次开会或会面中约有80%的时间需花费在路途中。
(2) 提高开会的效率;
由于召开电视会议的费用大致与开会的时间成正比,可促使与会代表节省时间,提高效率。由于参加会议的人员就在本地,和会议有关的材料、文件、实物都在身边,可以充分方便地交流。
(3) 适应某些特殊情况;
对于某些交通状况不好,特别是地处山区、边疆的城市,视频会议将带来极大的方便。
在一些紧急场合,如救灾、防汛,战地会议等,可以用视频会议系统及时了解或发布紧急情况和决策,收效则难以用金钱来衡量。
(4) 增加参会人员
视频会议可当作高质量的可视电话,连线两方诉说心情,也可多人多点参加形成会议。同时,视频会议系统具有投影、VGA端口以及数据流功能可以随时增加会议代表甚至召开全体会议。总部决策可即时传达到所有员工。
三、视频会议的实现方式
当前,视频会议的实现方式有三种:
(1) 电视台电视直播式视频会议。此方式需要租用专用的卫星通道,传输方式为单向转输,若要双向则必须租用两个信道。租用卫星的费用非常昂贵,时间越长,费用越高。另外会议方式需要专业技术人员,还必须通过复杂的审批手续。因此这种会议方式只能供一些特种行业单位如中央电视台使用。
(2) MPEG1、MPEG2(视频、音频、数据的压缩标准)压缩格式的视频会议系统。由于MPEG1的传输需要1.5M的带宽,MPEG2需要3M的带宽,且图像质量将随网络传输距离急剧下降,通常只能用于本地的高速网段上。即使是国内亦只有电信局这些具有自己网络资源的职能部门才能建立这种基于高带宽的专用的视频会议系统。而且随着IP网络的普及,这种高度浪费带宽资源的工作模式势必走向淘汰。
(3) 基于ITU(国际电信联盟)H.320 (H.320是国际电联的标准,多媒体会议议定书,其中包括语音,视频和数据会议)、H.323系列标准以及MPEG4压缩格式的视频会议系统的出现才使高贵的视频会议进入商用领域。但是由于MPEG4标准定立很晚,各家先行开发的MPEG4标准并不十分统一,这就造成了MPEG4标准的视频会议系统先天兼容性不足。现阶段市场上技术成熟并占真正主导地位的是基于H.320/H.323标准的视频会议系统。这种实施价格平易近人,网络要求不高(通常仅需要共享数据广域网或使用ISDN甚至使用Internet),技术已经成熟的视频会议系统才我们真正意义上的视频会议系统。H.323是指基于IP方式进行传输的视频会议;H.320是以IP以外的其它网络方式进行传输的视频会议,通常有ISDN(综合数字信息网),DDN(数字数据网络),帧中继,ATM等等。在H.323协议(IP)环境中视频会议系统可与其他业务如IP语音,IP数据共享带宽,从而可以让用户将已有的宽带广域数据网改造为视频、音频、数据三网合一的综合性平台,从而更充分地利用已有网络的网络资源。
四、视频会议系统的组成
会议系统的组成非常简单,每个会场安放一台视频会议终端,终端接上电视机或屏幕作为回显设备,接上网络作为传输媒介就可以了。一台终端通常有一台核心编解码器、一个摄像头,一个全向麦克风以及一个遥控器。核心编解码将摄像头和麦克风输入的图像及声音编码通过网络传走,同时将网络传来的数据解码后将图像和声音还原到电视机和音响上,即实现了与远端的实时交互。终端通过呼叫IP地址或ISDN号码进行连接(专线无需拨号)。但在有三点会场就必须采用MCU(视频会议多点控制单元)进行管理。
同电话交换机相似,MCU(多点控制单元)的作用就是在视频会议三点以上时,决定将哪一路(或哪四路合并成一个)图像作为主图像广播出去,以供其他会场点收看。所有会场的声音是实时同步混合传输的。在具有MCU的会议系统里,所有终端的音视频数据均实时传到MCU供选择广播。MCU的数据流量较大,通常接于网络的中心交换机上,控制人员通过笔记本电脑调用MCU管理界面在会场进行远程管理。呼叫方式可以由控制人员由MCU呼叫各个终端,亦可由各终端呼叫控设置好的会议号。
如果客户规划的视频会议系统网络比较大,在MCU下面还可建立另外视频会议网,两个网的MCU实现视音频交换,此种方法叫MCU的级连。比如,中央到各省的视频会议网络带宽为2M,省上自己亦有自己的视频会议系统。中央开会用自己的MCU,省上开会用省上的MCU,需要上传下达时,将MCU级连起来就可以了。级连的好处一是管理上不会混乱;二是到中央的带宽亦不允许省下面几十点的数据全挤到这上面来。
五、远程视频会议的难点及解决方法
(1)啸叫音
啸叫音是从扬声器传出来的,被麦克风拾取再次放大的嚎叫音。在不同的房间的音频系统中产生啸叫音是经常出现的,如果每个房间里的麦克风拾取了太多临近喇叭传过来的声音,并传输到其他的位置,就会通过麦克风再次拾取,并传回来。
(A)改变麦克风或旁边有影响的设备的位置,或者扬声器的位置。最好的方法是,将喇叭放置在定向麦克风的背后而不是上方,这样就不会对来自前方的声音过为敏感。
(B)将会议室里面扬声器的音量降低,降低音量,让听众不容易听到,减少音频系统产生啸叫的趋势。
(C)通过操作员的操作或者使用开关按钮,以及自动混合器,减少开启的麦克风的数量。减少开启的麦克风的数量与关闭整体音频系统的音量有着同样的效果,但却不会以降低听众所听到的音量为代价,这样大大减少了啸叫音产生的机会。
(D)通过添加声音吸收面板或覆盖层,让房间的墙面反射减小。在声音效果没有达到最佳状态的房间里,尽管两者之间没有直接的通道,麦克风到喇叭的结合情况也会出现,声音离开喇叭后,反射到墙、天花板或地板上,并间接到达麦克风。
(2)回音
当远程会议的位置连上了网络,产生了一些信号时延,来自远程位置的喇叭的声音泄漏进了那里的麦克风,产生的回音就会返回到原始的位置。换句话说,一个发言者在A会议室讲话,他的声音通过喇叭传到了B会议室,并泄漏到了B会议室的麦克风里,那么信号就会传输回A会议室,A会议室的发言者就会在说话之后的1/4-1秒之间,听到自己刚才所讲的话。如果泄露到B会议室的音量问题不是很严重,返回到A会议室的音量就可能很低,但是在绝大多数的情况下,回音都会很大,让A房间的人根本无法进行沟通。
解决回音问题,大多数的方法都是设法将长距离电话线的回音最小化。主要是采用了回音消除器,这种设备能够监视来自其他位置的音频信号,并与即将传输或发送的信号相比较。如果回音消除器在外出的信号中检测到了进入的音频信号,就会把进入的音频信号复制下来,并将其从输出的信号中删除。这样大大减少了回音量,但是并不能完全消除掉。注意,回音消除器用于阻止其他位置的音频信号返送回去,但并没有对其他地方可能发送到自己的位置的回音进行处理。由于这个原因,如果网络上的一个站点需要使用回音消除设备,那么在该网络上的大多数站点都需要回音消除器。
通用的回音取消器有2种。第一种,称为线性回音取消器,用于移除电话线上的电子回音,大多数的电话线路都使用这种设备。线性回音取消器不能够大幅度地降低来自会议室的扬声器-麦克风泄漏的复杂回音。第二种,称为回声抵消器,用户减少由于泄漏而产生的回音的几率。通常,很多人都误认为,回声抵消器能够将伴随房间的啸叫音移除,事实上,没有任何电子设备能够做到完全消除房间里产生的啸叫音。过量的反射声音可能导致回声抵消器不能够正常工作,并降低了回声抵消器能够减少的传输回音的量。回声抵消器会根据特定房间的具体情况,在1/10秒或稍长的时间内,“学习”如何降低回声,而且,无论从喇叭到麦克风的路劲如何改变,都必须经历这个“学习”过程。这可能是由无线麦克风用户在房间中不停移动而产生,也可能是麦克风被自动混音器不断开关而引起的。在这个“学习”过程中,回音不会被降低。
(3) 反射或“空洞”声音
在远程会议的音频系统中,一个最常见、最恼人的问题就是“空洞”声,这种声音听起来就像说话者在桶底发出声音一样,房间反射严重,就会产生这种现象。但是,任何电子设备都不能消除反射声音,只能一开始就不能让这种声音进入麦克风。
最为常见的解决方法,当然就是用特殊设计的声音吸收材料把房间的表面覆盖起来,减少房间的反射。如果,对房间声音的改变还是不能让音质得以提高,那么就必须减少同时开启的麦克风的数量,因为每个开启的麦克风都会在音频信号中,增加反射声音和背景噪音。定向麦克风能够降低反射音的拾取,但前提条件是放置的离发言者的距离必须小于临界距离,如果大于临界距离,定向麦克风就不能够展示出优势。最后,麦克风也可以轻松地移动,靠近发言者,这样发言者到达麦克风的声音就会大些,麦克风混音器就会将麦克风的敏感度降低,以此降低其对反射音和背景噪音的敏感度。
(4)在这里有几处要强调的地方:
一、是音频数据量(小于等于64K)远远小于视频的数据量,编码的时延也比视频时间短。因此在早期的视频会议系统中经常会出现听到声音后很久才看到人嘴动的情况。业界术语叫唇音同步。现在的视频会议知名品牌都在音频编码后加入一定的时延,唇音同步问题已完全解决。
二、在传输的信息里面,优先级的排列顺序为:音频->视频->控制信令->数据。因为会议以说话为主,在网络拥塞时,画面可能会有马塞克,但会议的声音必然首先保证是连贯和清晰的。
三、视频会议还有一些有待改进的地方。眼睛交流是面对面交流中最重要的一部分,大多数的视频会议中,往往都是与会者注释这屏幕上远程他方会议者的图像,而不是直接对着摄像机。一些研究发现,在一个合作环境中,眼部交流能够产生相互信任和鼓励,而缺乏眼部交流则会产生消极的、不舒适或者不信任的感觉。在视频会议中形成自然的眼睛交流要求与会者望着摄像机,但是,传统的视频会议在这方面通常都很失败,因为与会者会很自然地望着屏幕上远程与会者的视频图像,而不是摄像机。
一些公司目前正在建立一种系统,使用双向镜面,将摄像头安装在屏幕后面,直接提供眼部交流。但是,这种技术还不是行业发展的主流,目前,眼睛交流的解决方案通常都非常昂贵。
六、远程视频会议的前景
中国城市IP系统载体基础设施建设得很好,城市之间的联系非常方便,中国的视频会议市场已经成熟。据著名市场研究公司的发展预测,全球视频会议网络设备的销售额的年平均增长率将达到27%。在未来三四年中,视讯会议市场将达到50亿-60亿美元的市场容量,而中国无疑将是一个重要组成部分。因此,目前活跃在中国视频会议市场上的设备生产商数量颇多,国外的公司有Polycom、Tanberg、VTEL、VCON等,国内的公司有华为、中兴等。为适应视频会议发展的需要,它们一直在不断推出新型产品以应对市场激烈的竞争。
而且,近年来由于人们使用习惯的改变和观念的进步,中小企业也开始采用了视讯会议系统。同时,视讯会议系统技术发展也推动了它的普及,目前只要用户具有5-10个分支节点,就可以方便地使用视讯会议系统。在购买视频会议系统时应当注意以下几个方面:视频会议系统是否与其他品牌的系统一起工作;视频会议供应商能提供怎样的服务水平;视频会议系统是否能在IP标准系列,如H.323标准下工作;视频会议系统是否支持多点会议,例如与好几个地点链接,是否需要增加额外的硬件和软件;视频会议系统投入市场时间的长短,如何与未来的系统和技术集成,制造商是否已经为将来作了详细的战略规划;来自制造商的视频会议系统是否有可靠的音频/视频声誉。