ISSN 1002-4956 CN11-2034/T
实 验 技 术 与 管 理 Experimental Technology and Management 第37卷 第6期 2020年6月
Vol.37 No.6 Jun. 2020
DOI: 10.16791/j.cnki.sjg.2020.06.040
麦克风阵列声源定位的实验设计与实现
罗 倩
(北京信息科技大学 信息与通信工程学院,北京 100192)
摘 要:基于麦克风阵列的声源定位技术,可以应用在智能交互、智能家电、视频会议、语音识别等领域。该文设计了一个使用麦克风阵列进行声源定位的综合型实验项目,并应用到本科生开放创新实验中。实验充分利用多个麦克风阵元间的空域和时域信息,采用时延估计算法对不同阵元波达时间延迟进行估计。通过构建阵元几何关系并利用阵元信号的时延,获得了在噪声环境下较好的声源定位效果。教学实践表明,该实验项目可以较好地拓展学生的信号处理能力,有利于对学生创新设计能力和解决复杂问题能力的培养。 关键词:麦克风阵列;声源定位;时延估计;实验设计
中图分类号:TP391.9;G642.423 文献标识码:A 文章编号:1002-4956(2020)06-0185-04
Design and realization of experiment for sound source
localization based on microphone array
LUO Qian
(School of Information and Communication Engineering, Beijing Information
Science and Technology University, Beijing 100192, China)
Abstract: Sound source localization technology based on microphone array can be applied in the fields of intelligent interaction, smart home appliances, video conferences and speech recognition, etc. A comprehensive experimental project by using a microphone array for sound source localization is designed and applied to undergraduate open innovation experiments. By making full use of the spatial and temporal information between multiple microphone array elements as well as the time delay estimation algorithm, the time delay of different array elements is estimated. By constructing the geometric relationship of the array elements and using the delay of the array element signal, a better sound source localization effect under noisy environment is obtained. The results show that this experiment can better expand students’ signal processing ability, which is conducive to the cultivation of students’ innovative design ability and their ability to solve complex problems.
Key words: microphone array; sound source localization; time delay estimation; experiment design
使用麦克风阵列的声源定位技术能在嘈杂背景阵列,对空间传播的声音信号进行采样,采样信号包含了空间位置信息。麦克风阵列声源定位通过对各阵元信号的到达时延(time delay of arrival,TDOA)进行估计[7-9],定位声源位置,计算量较小,可以获得较好的定位效果,易于实时实现[10-11]。利用时延补偿和空间滤波方法,又可进一步对来自声源的信号进行增强,达到抑制噪声的效果[1,12-13]。
为了加强“信号与系统”教学中实验教学与理论教学的相互结合,加强学生对信号处理技术的认知,培养学生自主学习和独立解决复杂问题的能力,建立了使用麦克风阵列实现声源定位的实验教学系统,并应用在大学生开放实验项目中。通过利用麦克风阵列
下实现声音降噪、语音增强、智能交互、智能家居控制等[1-4]。在实际语音通信环境中,不仅存在环境噪声,多数场合下还存在声音的多路径反射和混响等问题,并且讲话者有时是运动的,这些因素都会降低单个麦克风接收信号的信噪比,导致语音通信质量的下降。引入麦克风阵列可以很好地解决上述问题[5-6]。麦克风阵列是由多个麦克风按照一定的拓扑结构组成的
收稿日期: 2019-10-22
基金项目: 北京信息科技大学2018年教改项目(2018JGZD06) 作者简介: 罗倩(1965—),女,广东兴宁,博士,副教授,主要研究方向为信号与信息处理。
E-mail: luoqian@bistu.edu.cn
186 实 验 技 术 与 管 理
进行语音信号采集,并处理多个麦克风传感器间的空域和时域信息, 较好地实现了声源定位。
1 麦克风阵列声源定位方法的原理
均匀线阵是常见的阵列结构,其中有N个麦克风等间距地排列在一条直线上。实验中采用远场模型。在远场模型中,声源到达麦克风阵元之前为平面波,到达麦克风阵列的方向角是相同的,忽略各阵元接收信号间的幅度差,近似认为各接收信号之间是时延关系。利用麦克风阵列估计声源到达不同阵元间的时间差,可以实现声源方向和距离的估计。基于延时估计的方法分为两步,首先进行声达延时估计,再利用声达时间差,结合已知的传声器阵列的空间位置,确定声源位置,以达到声源定位的目的。
图1是麦克风阵列声源定位的原理图。其中:d是两个麦克风阵元间的间距,c是声音在空气中的传播速度,θ是声源的方向角,r是声源到麦克风阵列中心的距离,s(n)是未知声源信号,yi(n)表示第i个麦克风接收到的信号:
yi(n)ns(nt(i1))vi(n)
(1)
其中:n(n1,2,,N)在0~1之间,是传播衰减因子,在远场模型中可忽略;t表示信号从声源传播到麦克风直线阵列中心的传播时间;vi(n)表示在第i个阵元上接收到的加性噪声,假设噪声与语音信号以及其他阵元的噪声信号互不相关;为中心麦克风阵元与相邻麦克风阵元所接收到的信号的时延差。这里假设使用的麦克风阵列模型为位于远场环境中的均匀直线阵列。
图1 麦克风阵列声源定位原理图
延时估计算法可以通过计算两个阵元接收信号的互相关函数来实现,找到使互相关函数最大的点,该点可确定这两个信号的时间差。
离散信号的互相关函数为:
Ryiyj(m)Eyi(n)yj(nm)
(2)
yj(n)表示第j个麦克风接收到的信号。在实验时,采用时间平均代替集合平均:
R1
yiyj(m)
N
yi(k)yjk|m|(3)
N
k|m|1
Ryiyj(m)在mm
ˆij时达到其最大值: ˆ
m
ijargmaxm
Ryiyj(m)
(4)
在计算时,可以采用快速傅里叶变换并通过反变
换计算互相关函数的最大值。根据互相关函数峰值的尖锐程度,可以判断时延估计性能的好坏。在处理时,对麦克风接收信号进行加窗分帧,每帧长度为512点,后一帧与前一帧重叠256点,用汉明窗对信号进行加窗处理。式(4)中估计的是i和j阵元一帧数据互相
关函数的最大值点。对各帧估计的mˆij进行平均可得到mij,作为输出结果。
于是所估计的yi(n)和yj(n)之间的延迟ˆij为:
ˆijmijTs
(5)
其中T
s为采样周期。
只要测出声音信号的到达时延ˆij,就可以计算声源到达两个麦克风的距离差,再根据图1的几何关系,即可计算出声源的方向角。声源方向角的计算公式为:
arc cos
ˆijc
(6n
) ijd其中:ˆ个麦克风接收信号的时延估
ij是第i个与第j计,nij为阵元i与j的阵元间隔数。
麦克风阵列中一般有多个麦克风,一般N>3,每两个麦克风都可以得到一个角度估计值,N个麦克风就会有N(N−1)/2个角度估计值。记每个角度估计为
k,k1,2,,N(N1)/2。角度估计的所有信息彼此并不独立,存在冗余。实验中将估计出所有组合的角度值,并利用最小二乘法求出最优解,这样可以利用所有阵元的信息来提高角度估计的准确性和鲁棒性。采用最小二乘法求解时,设总的误差平方和为:
k2
(7)
用最小二乘法求ˆ
,使得式(7)中的最小,即:
ˆargmin2
k(8) 这样可以得到声源方向的估计ˆ
,其值也是所有估计k值的均值。
通过计算声源到各麦克风之间的距离差,可以进一步估计声源距离r。
如图2所示,假设声源到麦克风Mic0和Mic1的
距离差为c01,声源到麦克风Mic0和Mic2的距离差
罗 倩:麦克风阵列声源定位的实验设计与实现 187
为c02,声源的坐标为(x,y),则可由下列方程组求得声源相对原点的距离r:
|x|d2 y2x2y2c01
(9)
|x| d2y2x2y2c02
(10) rx2y2
2d2c2012022
(11)
2c0102
由此,可以定位声源的距离。
图2 声源距离几何关系
2 实验教学系统设计与实现
实验采集系统由声望公司的4个MPA416驻极体全向麦克风、NI公司的1个USB9234四通道数据采集卡和计算机共3部分组成,NI数据采集卡通过USB接口与计算机相连。NI数据采集卡如图3所示,每通道以采样频率25.6 kHz进行同步采样,量化精度为
16 bit。
图3 NI USB9234数据采集卡
声源定位实验环境是一个8 m×6 m×3 m的自然环境长方体实验室,由4个麦克风传感器组成的直线阵列接收声音信号,它们位于高160 cm处,对应多数人说话的位置。实验系统如图4所示。麦克风阵元之间的间距为d=6 cm,声速为c=340 m/s,以4个麦克风的直线阵列中心为坐标原点。实验室噪声信号为高斯
白噪声,信噪比约为20 dB,声源为单声源。麦克风阵列采集系统示意图如图5所示。
图4 直线麦克风阵列实验系统图
图5 直线麦克风阵列采集系统示意图
为了保证短时平稳性,对采集数据进行加窗分帧处理,采用汉明窗,每帧512点,每帧信号与前帧信号重叠256点,并将各帧信号估计结果进行平均。
3 实验测试结果与分析
实验中,分别采集30°、45°、60°、90°、120°、
145°和150°各方向,距离线阵中心距离为4 m、5 m、6 m的定点声源的语音或手机铃声等信号。4个通道采集的声音波形示例如图6所示。
图6 4个麦克风采集的信号波形图
188 实 验 技 术 与 管 理
对采集的定点声源信号进行延时估计,将结果在帧间进行平均,并对各个估计值求最小二乘估计。不同声源方向角度估计的实验结果见表1,不同声源距离估计的实验结果见表2。
表1 不同声源方向角度估计实验结果
序号 声源角度/(°)
估计角度/(°)
1 30 28.35 2 45 45.95 3 60 58.26 4 90 91.02 5 120 118.74 6 135 133.57 7
150
148.63
表2 不同声源距离估计实验结果
序号 声源距离/m
估计距离/m
1 4.00 3.89 2 5.00 5.15 3
6.00
6.18
从表1和2中可以看出,本实验实现了对声源方向和距离的比较准确的估计,方位角度定位精度为
±1.74°,距离定位精度为±0.18 m。由于本实验采用了较高的采样率,进行了数据分帧,在帧间进行了估计值的平均处理,并充分利用了各冗余阵元的信息,采用了最小二乘估计算法,因此获得了较好的定位效果。
4 结语
本文设计了基于麦克风阵列的声源定位实验系统,设计了基于延时估计的麦克风阵列声源定位算法,通过充分利用麦克风阵列采集的时域和空域信息,利用帧间估计值平均以及麦克风阵列各阵元信息的最小二乘处理,获得了较好的声源定位效果。实验可以有效地提取声源的方位和距离,使学生将理论与实际应
用相结合。通过实验,有效地培养了学生的综合素质和创新能力。 参考文献 (References)
[1] 朱兴宇,万洪杰. 基于麦克风阵列的语音增强系统设计[J]. 计算机应用与软件,2013, 30(3): 240–243.
[2] 宫玉琳,文大化. 基于传声器阵列的机器人声源定位系统[J]. 长春理工大学学报(自然科学版),2016, 39(3): 41–44, 49. [3] 张帆,罗积浩,兰军建,等. 基于麦克风阵列的智能监控系统[J]. 电子测量技术,2013, 36(5): 114–118.
[4] 程风,翟超,吕志,等. 基于语音识别技术的智能家居主控设计[J]. 工业控制计算机,2018, 31(5): 29–31.
[5] 虞永强,陈演桐,郑金存. 阵列麦克风声源定位技术在师范生授课过程中的应用研究[J]. 电子技术,2018, 47(12): 42–44. [6]
VENKATARAMANI S, VELMURUGAN R, RAO P. Improving mobile phone based query recognition with a microphone array [C]// 2014 Twentieth National Conference on Communications (NCC). IEEE, 2014. [7] 蔡卫平,黄印君,陆泽橼. 基于分布式麦克风阵列的声源定位算法[J]. 计算机应用与软件,2014, 13(5): 132–135. [8]
NGUYEN T N T, TUNA C, ZHAO S, et al. A novel sparse model for multi-source localization using distributed microphone array[C]// IEEE International Conference on Acoustics. 2017. [9]
王汀洲,朱梦尧,吴修坤. 基于麦克风阵列的不一致性的校正[J]. 复旦学报(自然科学版),2018, 57(3): 344–349, 357. [10] 刘颖,胡瑞超. 基于总体最小二乘的多麦克风阵列狙击手定
位算法[J]. 科学技术与工程,2018, 18(6): 138–141.
[11] SU D, VIDAL C T, MIRO J V. Simultaneous asynchronous
microphone array calibration and sound source localisation[C]// IEEE/RSJ International Conference on Intelligent Robots & Systems. 2015.
[12] 陆灏铭,陈玮,刘寿宝. 基于麦克风阵列的声源定位系统设
计[J]. 传感器与微系统,2012, 31(4): 79–81, 85.
[13] NONGPIUR R C. Design of minimax broadband beamformers
that are robust to microphone gain, phase and position errors[J]. IEEE/ACM Transactions on Audio Speech & Language Processing, 2014, 22(6): 1013–1022.
因篇幅问题不能全部显示,请点此查看更多更全内容