admin 管理员组

文章数量: 887021


2024年2月19日发(作者:rowindex是什么意思)

TCL AV事业部 研发所 软件室

Audio知识简介

干一行专一行VS学一行丢一行

第一部分:HTS基本概念:

HTS(Home Theater System)通俗的讲就是将电影院搬到家里,然后就成了家庭影院,就公司的产品而言可以简单的理解为:DVD/BD player + 功放 + Speaker

组成:节目源(碟片+碟机等)+ 放声系统(AV功放+音箱组等)+显示部分(电视机/投影仪)

配置家庭影院的好处:高清晰的如水晶般的画面,环绕的立体声,清晰的人声,震撼的低音效果,可以提供几乎身临其境的感觉。在强烈的视听冲击下,能感受到现实和虚拟的完美交汇,触发更深的人生感悟。

第二部分:Audio

百度定义:

1. Audio指人说话的声音频率,通常指300Hz---3400Hz的频带

2. 指存储声音内容的文件

3.在某些方面能指作为波滤的振动。

音频这个专业术语,人类能够听到的所有声音都称之为音频,它可能包括噪音,声音被录制下来以后,无论是说话声,歌声乐器都可以通过数字音乐软件处理。把它制作成CD,这时候所有的声音没有改变,因为CD本来就是音频文件的一种类型。而音频只是储存在计算机里的声音,演讲和音乐,如果有计算机加上相应的音频卡,可以把所有的声音录制下来,声音的声学特性,音的高低都可以用计算机硬盘文件的方式储存下来,反过来,也可以把眄来的音频文件通过一定的音频程序播放,还原以前录下的声音。

Audio的分类:

按编码格式分类:

mp3,wav, aac, ogg, flac, aiff, ac3(亦称之Dolby digital), dts, pcm, Dolby true hd(HD),

Dolby digital plus(HD), dts hd master audio(HD), dts hd high resolution audio(HD), dts

hd low bit rate(HD)

多声道音频的分类:

C:center L: left front R: Right front

LS: Left surround RS: right surround S: surround(单个环绕声道)

LB:left back surround RB: right back surround

Cs: Center surround

1.带LFE声道的分法:根据码流中实际的通道数分

X的值为0/1, 0表示不带LFE通道,1表示含LFE通道

TCL AV事业部 研发所 软件室

1.xC 如1.0 为C, 1.1为C+LFE

2.x->L+R

3.x->C+L+R

4.x->L+R+LS+RS

5.x->L+R+C+LS+RS

6.x->L+R+C+LS+RS+Cs

7.x->L+R+C+LS+RS+LB+RB

2.不带LFE声音的分法:根据喇叭摆放的位置分

其中C/L/R均摆放在前面,LS/RS/S/LB/RB均摆在两边/后面,如下图

1/0->C

2/0->L+R

3/0->C+L+R

2/1->L+R+S

2/2->L+R+LS+RS

3/1->L+R+C+S

3/2->L+R+C+LS+RS

3/3->L+R+C+LS+RS+Cs

3/4->L+R+C+LS+RS+LB+RB

3.声音信号的传输:

(1)定义及I2S总线构成:

I2S(Inter-IC Sound)总线是飞利浦公司为数字音频设备之间的音频数据传输而制定的一种总线标准,该总线专责于音频设备之间的数据人,广泛应用于各种多媒体系统。

一般包含三根CLK总线和多达四根的DATA总线,最多可以传输7.1通道的数

TCL AV事业部 研发所 软件室

据。

MCLK(主时钟):(系统时钟 Sys Clock),使系统间能够更好地同步。

SCLK(串行时钟):(位时钟BCLK),即对应数字音频的每一位数据,SCLK都有一个脉冲。SCLK的频率=2*采样频率*采样位数

目前我接触到的采样位数基本上都是32bit ,

LRCLK(左右时钟):用于切换左右的数据,LRCLK 为1表示正在传输左声道的数据,为0则表示传输的是右的数据,LRCLK的频率等于采样频率。

SDATA(串行数据):就是用二进制补码表示的音频数据。由于LRCLK定义为切换左右声道的数据,所以一根DATA线上可以传输两个通道的数据,即两个通道的声音。最多可以有四根DATA线,最多可以传输8个通道的数据(7.1声道)。

DATA线上通道传输的组合及顺序都有约定的组成:

DATA0:L/R DATA1:C/SUB DATA2:LS/RS DATA3:LB/RB

(DATA1上也有可能是LS/RS,DATA2上也可能会是C/SUB,具体得参考软件的输出及硬件原理图)

目前公司的AUDIO产品大多是2.0/2.1/5.1,分别需要1/2/3根DATA线

(2)三种频率之间的关系

LRCLK:等于采样频率,采样频率通常有以下几种:

8,000 Hz - 电话所用采样率, 对于人的说话已经足够

11,025 Hz

22,050 Hz - 无线电广播所用采样率

32,000 Hz - miniDV 数码视频 camcorder、DAT (LP mode)所用采样率

44,100 Hz - 音频 CD, 也常用于 MPEG-1 音频(VCD, SVCD, MP3)所用采样率

47,250 Hz - Nippon Columbia (Denon)开发的世界上第一个商用 PCM 录音机所用采样率

48,000 Hz - miniDV、数字电视、DVD、DAT、电影和专业音频所用的数字声音所用采样率

50,000 Hz - 二十世纪七十年代后期出现的 3M 和 Soundstream 开发的第一款商用数字录音

机所用采样率

50,400 Hz - 三菱 X-80 数字录音机所用采样率

96,000 或者 192,000 Hz - DVD-Audio一些 LPCM DVD 音轨、BD-ROM(蓝光盘)音轨、和 HD-DVD

(高清晰度 DVD)音轨所用采样率

2.8224 MHz - SACD、 索尼 和 飞利浦 联合开发的称为 Direct Stream Digital 的 1 位sigma-delta modulation 过程所用采样率。

但是在公司接触比较多的只有以下几种采样频率:

TCL AV事业部 研发所 软件室

1FS:32K/44.1KHz/48KHz 2FS: 64KHz/88.2KHz/96KHz

4FS: 128KHz/176.4KHz/192KHz

FS为frequency sample.

LRCLK:在高清码流,dolby true hd/dolby digital plus/dtshd等,又会有传输采样率与码流采样率。

默认情况:高电平时传输的是左声道的数据,低电平时传输的是右声道的数据。

传输采样率指的是这些码流还没有经过解码时的LRCLK。

码流采样率是指解完码之后,如高清码流解成PCM等之后的传输采样频率。

通常的传输采样率为4FS,即为128KHz/176.4KHz/192KHz。

MCLK与LRCLK的倍率关系一般为128/256/384/512

MCLK的值可以为8.192MHz / 16.384MHz/ 11.2896MHz /22.5792MHz/

12.288MHz / 24.576MHz

虽然24.576*2,22.5792*2, 16.384*2MHz理论上存在,但是我看到这样的MCLK都是异常情况下的。(没有声音)

SCLK:=2*采样频率*采样位数(通常是32位)

=64*采样频率

(2.048MHz/4.096MHz/8.192MHz/2.8224MHz/5.6448MHz/11.2896MHz/3.072MHz/6.144MHz/12.288MHz)

其中MCLK/SCLK/LRCLK三者之间的倍数关系很重要,如果声音出现异常或者没有声音,我们可以通过测量这些信号来指导我们调整软件。

例如:在ST309中,我们就要配置0x00reg来配置这些参数。

(3)三种IIS传输格式:

根据SDATA数据相对于LRCLK SCLK的位置不同,分为左对齐(使用较少),I2S格式(即飞利浦规定的格式),和右对齐(也叫日本格式,普通格式)

举例:标准格式:

TCL AV事业部 研发所 软件室

左对齐格式:

以上是理论上的图形,以下是用三根探头的示波器测得的标准的I2S的图示。

第一根黄色线是LRCLK,第二根线是BCLK,第三根线是DATA。

从图中DATA是从BCLK的第二个周期开始的,很容易就看出来这个是属于标准的I2S格式。

TCL AV事业部 研发所 软件室

3. SPDIF output/HDMI output

这里面的东西很多,我把我知道的注意事项写一下:

(1) BD player->spdif->BD HTS

spdif audio 设置成bitstream,

我们知道SPDIF只能传输标清的AUDIO,那么如果BD Player播放的是DTS HD/DOLBY true HD/Dolby digital Plus等高清信号时,BD player此时输出的会是什么呢?其实传输的还是标清信号,如果是DOLBY TRUE

HD的信号,那么会转成标清的AC3即DOLBY DIGITAL信号,同理DTS HD会转成DTS的信号传输,高清的后环绕通道会丢失,且编码方式都将是标清时相应的编码方式。

注意SPDIF传输的是数字信号:

以下是一个比较正常的信号,看到图的高电平处有一个尖峰,(过冲,是信号经过磁珠,电容,电感等元件引起)

图中为48K的WAV文件的信号。

下图也是一种能够正常出声音的96K的WAV文件的信号图示。

信号能够大致分0/1

TCL AV事业部 研发所 软件室

如下是一个不正常的同轴信号,信号幅度不一,区分不出0/1

(2) BD player->HDMI->BD HTS

TCL AV事业部 研发所 软件室

HDMI audio设置成bitstream

SPDIF只能传输标清信号,HDMI是可以传输高清信号的,但是当HDMI

audio设置成bitstream,播放高清信号输出的也并一定是高清信号,例如:播放DOLBY TRUE HD传输到BD HTS可能是标清信号AC3,

这里有一个条件就是resolution, 只有将BD Player的setting->TV->resolution设置成1080I或者1080P,这样输出给BD HTS的信号才是高清信号。

第三部分:audio的处理。

这部分我将audio的音效处理,音量处理,增益平衡都包括了进来。

主要的处理内容有:

音效处理类:Dpl2 Dolby prologic 2/DVS dolby vitual speaker/EQ/Bass

management/Delay/Tone Control

音量处理类:sound tuning/power derating/volume+/-

其他:DRC

DPL2:Dolby 的算法,DTS公司的类似算法为NEO6,Philips为Ambiound,

算法的用途为将2.X声道的数据转化成多通道声音的数据。用于5.1通道的HTS。

DPL2有以下几种模式:MOVIE MODE/MUSIC MODE/MATRIX MODE/VIRTUAL

MODE/Pro Logic Emulation Mode

在CS 的DSP的系列芯片中DPL2只支持1FS/2FS。在4FS下调用DPL2是没有效果的。

在调用DPL2时,将两通道的数据转成5.1,此时DPL2的CENTER的声音会比较大,其他几个喇叭会相对减小,因为DPL2的作用是将LR相同的部分转至CENTER,

LR保留的只是不相同的部分,

调用DPL2 Movie和DPL2 Music,算法本身带有Delay. Movie有10---25ms的Delay, Music则存在0---10ms的Delay。

如下是用转门的DPL2测试碟53曲测试通道LS(相对LR),并将Delay 调整为5ms时的截图,DPL2的延时从图中看出为14.1MS(相对左右).

Dolby PLII Time Delay Fig.1.51500m0-500mV-1-1.5-2-2.5-3-10m010m14.1m20m30m40msecSweep11Trace12ColorCyanGreenLine .1 .TCL AV事业部 研发所 软件室

dx=14.10 msec32.521.51500m0-500m-150m60m70m80m90m100m-1.5VDolby Pro Logic II Ls Channel Delay TestingMode: ABCDUpper Trace: Undelayed Signal - Left ChannelLower Trace: Delayed Signal - Ls ChannelDelay Time = #### msDisplay Reads: Ls = ### (time or distance) L = ### (time or distance)Time 27

DVS:Dolby vitual Speaker,将多通道的声音数据转化成更少通道的数据(一般为两通道),并在听感上有环绕声的效果。当然有处理2.X/3.X等几种效果的DVS.

在DVS模式下如果输入的码流不是多通道的话,则需要DPL2将其转成多通道,再调用DVS算法。

用于2.1/5.1的BD HTS。

DVS有两种模式:reference mode/wide mode/bypass mode

Reference mode与wide mode的区别:(在于模拟出来的喇叭个数是不一样)如下图:

Speaker layout:系统中实际的喇叭数。

Discrete Channels:码流的通道

Virtualized Channels:虚拟出来的喇叭

在CS的DSP的系列芯片中DVS只支持1FS,在2FS/4FS下调用DVS都是没有效果的。

Bass management:低音管理,从L/R/LS/RS/C等通道中将低频的数据分离出来到SUBWOOFER的通道。

在SUBWOOFER通道里面的数据有两种:一种是通道低音管理分离出来的低频

TCL AV事业部 研发所 软件室

数据,另外一种就是DOLBY/DTS 等里面的专门的.1数据,即LFE通道。

举个例子:在AUX/MP3 LINK这些模拟SOURCE,由于传输的通道最多两个,左声道以及右声道,不存在LFE通道,必须用到低音管理,SUBWOOFER才有可能出声音!

而在SPDIF/HDMI等外部SOURCE下如果传输的是DOLBY等AC3的流时,由于本来就已经存在LFE的通道,所以就不需要低音管理,SUBWOOFER也会有正常的重低音输出。

DELAY:分通道DELAY和LIPSYNC

通道DELAY,所有的DELAY值都是相对于左通道而言的。

LIPSYNC:唇齿同步,用于调整说话的嘴形与声音的同步

在软件里面这两个功能都是用相同的寄存器去控制的。

通常有两种单位,M和MS,这两个单位都是可以进行换算的

因为声音的传输速度为340M/S 而MS毫秒的

10M = 30MS*340M/S = 0.03*340 = 34*0.3 = 10M

所以10M对应30MS

Sound tuning:这个名词引用于Philips,在我们公司这个名词的含义是:在各个source在不同的码流,以及不同的surround模式下(还有可能要不同的码流通道数)在某一级音量下达到某一个功率指标。

但是这个名词对于PHILIPS来说含义要多加一层。除了以上的功能之外还包括PRESET EQ和EQ,对于Philips,他们要的sound tuning OK的软件就是包含所有要调试的音量以及音效功能都OK的软件。(此乃经验教训)

Power derating:过功率控制,通过一个硬件检测脚一直检测当前的功率,如果超过一定功率(PHILIPS规格要求是额定功率的半功率)超过一定时间(PHILIPS通常要求是一分钟或者半分钟),软件自动且缓慢降低当前功率直到低于额定功率的半功率。

第四部分:音频处理流程

TCL AV事业部 研发所 软件室


本文标签: 声音 传输 信号 音频 数据