Advanced
Building Korean Head-related Transfer Function Database
Building Korean Head-related Transfer Function Database
Transactions of the Korean Society for Noise and Vibration Engineering. 2014. Apr, 24(4): 282-288
Copyright © 2014, The Korean Society for Noise and Vibration Engineering
  • Received : November 19, 2013
  • Accepted : February 21, 2014
  • Published : April 20, 2014
Download
PDF
e-PUB
PubReader
PPT
Export by style
Article
Author
Metrics
Cited by
TagCloud
About the Authors
대 혁 손
KAIST, Department of Mechanical Engineering
영 진 박
Corresponding Author ; Member, KAIST, Department of Mechanical Engineering E-mail :yjpark@kaist.ac.krTel : +82-42-350-3060, Fax : +82-42-350-8220
윤 식 박
KAIST, Department of Mechanical Engineering
세 진 장
KETI, Digital Media Center

Abstract
Three-dimensional multimedia industry such as 3D TV, movie and broadcast has been developed vividly. For generating 3D contents with high quality, virtual auditory display, so called VAD, is being researched to offer more realistic experience to listeners. When people render VAD using headphones or two speakers, head-related transfer function(HRTF) plays a key role. The best solution is measuring all individuals’ HRTFs, but it is hard to measure all listeners’ HRTFs. To overcome this difficulty, many research groups have tried to construct their own measurement system and to build HRTF databases. However, some of them have not enough subjects or spatial resolution and they are mainly focused on Caucasian. There exists difference between Korean and Caucasian in a view of physical features. In other words, if Koreans hear three-dimensional sound rendered by HRTF database based on Caucasian, performance might be hindered. To verify this possibility and remedy the drawbacks, construction of new HRTF database aimed at Korean is needed. Therefore, our laboratory built HRTF measurement system which can measure HRTF of three-dimensional space with dense spatial resolution. With this system, 55 Korean males and 45 females’ HRTFs were measured and Korean HRTF database was built based on these data.
Keywords
1. 서 론
최근 3차원 멀티미디어 기술에 관한 수요와 연구가 증가하면서 영상에 부합하는 3차원 입체 음향에 대한 관심 또한 높아지고 있다. 이러한 기술을 높은 품질로 제공하기 위해서 피실험자의 머리전달함수정보를 보유하고 있어야 한다. 머리전달함수는 머리주변 임의의 위치에 존재하는 음원에서 방사되는 음압과 양 귀 고막에 도달하는 음압간의 전달함수를 의미하며 (1) , 방위각과 고도각에 따라 그 값을 달리한다. 또한 머리전달함수가 인간의 머리, 몸체 및 외의 등에 의한 음파의 산란 및 회절에 의해 영향을 받으므로 개인마다 머리 크기나 귀의 형상에 따라 그들만의 고유한 머리전달함수를 갖게 된다 (2) . 하지만 현실적으로 모든 피실험자의 데이터를 측정하는것은 불가능하기 때문에 국외의 다양한 연구소와 연구센터에서는 Table 1 과 같이 머리전달함수 측정 시스템을 개발하고 데이터베이스를 구축하였다. 몇몇 데이터베이스들은 조밀하지 못한 공간 분해능을 갖고, 또한 통계적으로 의미를 찾을 수 없을 정도로 적은 수의 피실험자를 측정한 데이터베이스들도 있다. 또한 개인의 인체정보의 차이는 머리전달함수정보의 차이를 불러오지만 기존의 주로 서양인을 대상으로 구축한 데이터베이스를 활용하여 한국인에게 적용한다면 오차가 발생할 가능성이 존재한다. 이를 극복하기 위해 이 연구에서는 한국인을 대상으로 한 한국형 머리전달함수 데이터베이스 구축과 전달함수 측정을 위해 개발한 머리전달함수 측정 시스템에 대해 소개한다. 그리고, 가장 많이 사용되는 CIPIC 머리전 달함수 데이터베이스와 양이간 시간차를 비교한다.
Public HRTF databases
PPT Slide
Lager Image
Public HRTF databases
2. 머리전달함수 측정 시스템
- 2.1 머리전달함수 측정 시스템
한국인의 머리전달함수 측정을 위해 우리 연구실에서는 Fig. 1 과 같이 머리전달함수 측정 시스템을 개발하였다 (7) . 머리전달함수 측정 시스템의 사양을 나타내면 Table 2 와 같다.
PPT Slide
Lager Image
HRTF measurement system
Specification of HRTF measurement system
PPT Slide
Lager Image
Specification of HRTF measurement system
공간분해능 5˚로 머리전달함수 데이터베이스 구축이 가능하도록 49개의 스피커를 사용하여 고도각의 공간분해능을 5˚로 해주었으며, 방위각은 정확한 모터를 이용해 조절하는 방식으로 작동된다. 총 측정점은 1729개가 되며, 음원과 피실험자 사이의 거리는 1.16 m 이다. 측정 장소로는 실험실 환경이 사용 되었으며, 이는 다음 절에서 설명할 것이다. 또한, 입력 신호는 로그 정현파 스윕 신호를 사용하여 측정 시간을 10분 이내로 줄일 수 있었기 때문에 측정 중 피실험자의 움직임에 의한 영향을 줄일 수 있었다. 마지막으로, 피실험자의 머리 위에 카메라를 두어 피실험자가 측정 중에 자신의 머리 위치를 실시간으로 확인할 수 있도록 하여 머리 움직임을 의 식적으로 줄일 수 있도록 하였다.
- 2.2 검증
머리전달함수 측정은 주로 무향실 환경에서 입력 신호로는 백색 잡음을 이용하여 이루어진다. 머리전달함수 측정 시스템이 Fig. 1 과 같이 복잡하기 때문에, 설치와 분해에 걸리는 노력을 줄이기 위해 머리 전달함수 측정을 위한 실험실 환경을 구축하였다. 또한, 측정 시간을 단축시키기 위해서 입력 신호로는 로그 정현파 스윕 신호를 사용하였고 이에 대한 검증을 하였다.
- (1) 실험실 환경에 대한 검증
머리전달함수를 무향실에서 측정하는 이유는 무향실이 높은 신호 대 잡음비를 갖기 때문이다. 따라서 높은 신호대 잡음비를 확보할 수 있다면, 청음실 또는 반무향실 환경에서 측정해도 무방할 것이다. 앞서 언급하였다시피 측정 시스템의 설치와 해체에 상당히 많은 시간과 노력이 필요하기 때문에 이를 해결하기 위해, 머리전달함수 측정만을 위한 실험실 환경을 구축하였다. 방위각, 고도각 0˚에 위치한 스피커에서 방사된 소리를 더미 헤드의 귀에서 측정한 음압과 실험실에 측정한 배경 소음의 파워 스펙트럼밀도 함수를 그려보면 Fig. 2 와 같다. 그림을 통해, 구축한 실험실의 신호대 잡음비가 약 40 dB이상이 되는 것을 확인하였으며, 따라서 실험실 환경에서도 머리전달함수의 측정이 가능할 것이다.
PPT Slide
Lager Image
Signal to noise ratio of experimental room
또한, 실험실에서 측정한 머리전달함수와 무향실 환경에서 측정한 머리전달함수를 비교하면 Fig. 3 과 같이 차이가 거의 없음을 확인하였다 (7) .
PPT Slide
Lager Image
Verification of experimental room
- (2) 입력 신호에 대한 검증
측정 시간의 단축을 위해 입력 신호로 주로 사용되는 백색 잡음 신호가 아닌 로그 정현파 스윕 신호를 사용하고자 한다. 앞의 절에서 구축한 실험실의 잔향시간이 약 90 ms인 것을 바탕으로 스윕 신호간의 간격이 100 ms인 로그 정현파 스윕 신호를 입력 신호로써 사용하도록 할 것이다. 검증을 위해 1s의 백색 잡음 신호를 입력 신호로 사용한 경우와 Fig. 4 에서 볼 수 있듯이 로그 정현파 스윕 신호를 사용한 경우에도 백색잡음의 경우와 마찬가지로 피크와 노치 패턴들이 왜곡되거나 사라지지 않고 남아있는 것을 확인할 수 있다.
PPT Slide
Lager Image
Left ear HRTF with different input signals
보다 정확한 비교를 위해서, 두 머리전달함수 스펙트럼 사이의 차이인 HRTFD를 Fig. 5 와 같이 비교하였다. 앞의 결과와 마찬가지로 두 머리전달함수 크기 스펙트럼간의 차이가 거의 없음을 확인할 수 있다. 이러한 결과들을 통해, 구축된 실험실에서 로그 정현파 스윕 신호 간격을 100 ms로 해주었을 경우에 머리전달함수의 정확한 측정이 가능한 것을 확인하였다. 따라서, 머리전달함수의 측정에 소요되는 시간을 10분 이내로 줄일 수 있었다.
PPT Slide
Lager Image
Left ear HRTFD of different input signals
3. 한국형 머리전달함수 데이터베이스
- 3.1 인체계측정보
머리전달함수 데이터베이스의 완성도를 높이기 위해 피실험자의 인체계측정보 또한 측정하였다. 이는 인체정보와 머리전달함수의 상관관계에 관한 다양한 연구에 활용될 수 있을 것이다. 측정한 인체계측정보는 총 21개로 Fig. 6 과 같다.
PPT Slide
Lager Image
Anthropometry
이 중 13개의 정보는 머리와 몸통에 관한 것이고, 8개는 귀에 관한 정보이다. 각각의 인체계측정보의 명칭을 표로 나타내면 Table 3 과 같다. 인체계측정보 중 앉은키, 머리 둘레, 어깨 둘레는 직접 측정하였고, 나머지 신체 치수는 피실험자의 정면, 측면, 귀 근접사진을 기준으로 활용될 수 있는 단위 길이와 함께 촬영하여 측정하였다. 이때, 오차 범위는 ±0.5 cm라고 볼 수 있다. 하지만 몇몇 인체계측정보의 경우 피실험자의 머리 모양이나 옷에 의해 약간의 추가적인 오차를 가지고 있을 수 있다.
Anthropometry
PPT Slide
Lager Image
Anthropometry
구축하고자하는 머리전달함수 데이터베이스가 한국인을 대표할 수 있는 가를 확인하기 위해 기술표준원에서 제공하는 한국인 인체치수조사 자료와 남성 피실험자에 대해서 6개의 정보를 Table 4 와 같이 비교하였다. 그 결과 평균값이 1 cm 이하의 작은 오차를 보였다. 따라서 인체계측정보 측면에서 이 데이터베이스는 한국인을 대표할 수 있다.
Anthropometry comparison
PPT Slide
Lager Image
Anthropometry comparison
- 3.2 한국형 머리전달함수 데이터베이스
먼저, 한국인의 머리전달함수 데이터베이스 구축을 위해 측정된 피실험자는 20, 30대 한국인 남성 55명과 여성 45명이다. 이 머리전달함수 데이터베이스는 1729개의 측정점을 가지고 있다. 이는 사용한 측정 시스템이 직교 극좌표계를 바탕으로 설계되었기 때문이다. 이는 각도를 표현하는 방법이 구 좌표계와 동일하기 때문에, 특정 고도각에 대한 방위각 변화에 따른 머리전달함수를 살펴보기에 용이하기 때문이다.
인체계측정보의 경우 피실험자 한 명당 21개의 정수 값을 가지기 때문에 데이터의 크기면에서 매우 작다. 하지만 머리전달함수의 경우 실험을 통해 얻은 기본 데이터가 한 명당 1.5기가바이트로 100명의 데이터를 모두 합하면 150기가바이트가 되어 모바일 어플리케이션 등에 적용을 위해서는 데이터 사이즈의 축소가 필요하다. 이를 위해서 먼저 후처리 작업을 통해 불필요한 데이터들을 정리하고 소음에 의한 영향을 제거해주었다. 또한, 주파수 영역과 시간 영역에서의 머리전달함수는 서로 푸리에 변환을 통해 생성해줄 수 있는 점을 감안하여 시간 영역에서의 머리전달함수만을 저장하여 제공하기로 하였다. 그 결과 한측정점당 시간축으로 512개의 데이터로 초기 시간 지연과 직접파와 신체 형상에 의한 반사파까지 표현이 가능한 것을 확인하여 채택하였다. 시간 영역의 머리전달함수를 제공하는 이유는 실제로 머리전달함수가 가상 입체 음향 구현 시스템 등에 사용될 때 시간 영역에서의 형태로 필터링 되는 경우가 많기 때문에 활용도를 높이기 위함이다. 마지막으로 앞의 절에서 언급하였듯이 한 등고도각 평면당 72개의 데이터를 포함하고 있기 때문에, 512×72×24의 3차원 행렬로 고도각 –30˚부터 85까지의 머리전달함수를 저장하였고, 512×1의 벡터로 고도각 90˚의 데이터를 저장하였다. 그 결과 한 피실험자당 머리전달함수 데이터를 약 5.7 메가바이트까지 줄일 수 있었다. 따라서 100명의 머리전달함수 데이터가 포함된 데이터베이스의 크기는 540 메가바이트 이내로 다양한 연구에 적용이 가능한 적합한 크기로 판단된다.
- 3.3 CIPIC 데이터베이스와 양이간 시간차 비교
실제로 한국인의 머리전달함수 경향이 서양인의 그것과 많은 차이를 나타내는지 확인하기 위해, 구축한 한국형 머리전달함수 데이터베이스를 가장 많이 사용되는 CIPIC 머리전달함수 데이터베이스와 비교하였다. 인간이 음원의 방위각을 인지하기 위해서는 주로 양이간 시간차와 양이간 레벨차를 이용한 다고 알려져 있다. 이때, 양이간 시간차는 음원에서 방사된 소리가 양쪽 귀에 도달하는 데에 걸린 시간의 차이를 의미한다. 이는 머리의 크기에 영향을 받는 함수이며 양쪽 귀의 시간영역 머리전달함수사이의 상호상관의 최대값을 찾는 방법으로 구할 수 있다. 한국형 데이터베이스의 경우는 방위각 이 90˚까지 구축되어 있지만, CIPIC 데이터베이스와 정확한 비교를 위해 CIPIC 데이터베이스와 같이 방위각 80˚까지 다음과 같이 비교하였다.
Fig. 7 을 통해, 방위각의 크기가 증가함에 따라 한국형 데이터베이스의 양이간 시간차 평균이 CIPIC의 경우보다 큰 것을 알 수 있었다. 이를 더 정확하게 비교하기 위하여, 양이간 시간차에 가장 큰 영향을 주는 인체계측정보인 머리 너비를 남성과 여성에 대해 모두 비교하였고 그 결과는 Table 5 와 같다.
PPT Slide
Lager Image
ITD comparison
Head width comparison
PPT Slide
Lager Image
Head width comparison
Table 5 를 바탕으로, 남성과 여성에 대해 모두 한국형 데이터베이스에 포함된 피실험자들이 CIPIC 데이터베이스에 포함된 피실험자들 보다 머리 너비가 약 1.5 cm 정도 더 큰 것을 확인할 수 있었다.방위각 80˚의 음원에 대해, 1.5 cm의 머리 너비차이에 의해 생기는 양이간 시간차의 차이는 구형 머리라고 가정했을 때 약 0.036 ms이다. 따라서, 실제 측정 결과를 바탕으로 한 Fig. 7 과 거의 동일한 결과를 나타냄을 알 수 있다.
마지막으로, 두 데이터베이스에 포함된 피실험자들의 귀의 형상 차이에 의해 고도각 변화에 따른 머리전달함수의 차이가 발생한다. 이는 기존의 연구를 통해 첫 번째로 발생하는 귓바퀴 노치 주파수에 차이가 있음을 확인하였다 (10) .
4. 결 론
한국인의 머리전달함수 데이터베이스를 구축하였다. 측정을 위해 개발한 측정 시스템에 대한 검증을 수행하였고, 이를 이용하여 한국인 100명의 머리전달함수를 측정하였다. 구축한 데이터베이스는 기존의 국외 머리전달함수 데이터베이스들과 비교하여 충분한 공간분해능과 측정점, 피실험자수를 갖도록 하였다. 인체계측정보 또한 측정하여 한국인 표준신체 치수와 비교하여 한국인을 대표할 수 있는 머리전달함수 데이터베이스라고 할 수 있었다. 또한, 머리전달함수 관련 연구에 가장 많이 사용되는 CIPIC 머리전달함수 데이터베이스와 양이간 시간차 관점에서 비교하여 그 차이를 확인하였다. 머리 크기가 실제로 더 큰 한국인의 경우가 양이간 시간차 또한 더 크게 나타났고, 기존의 연구를 통해서 귀의 형상에 의한 첫 번째 귓바퀴 노치 주파수도 차이가 남을 확인하였다. 따라서, 잘 구축된 한국형 머리전달함수 데이터베이스를 이용하여 향후에 다양한 한국인을 위한 3차원 가상 입체 음향 연구에 도움이 될 것으로 기대된다. 향후 과제로는 데이터베이스의 보다 정확한 검증과 표준 머리전달함수를 추출하고 맞춤화 하는 연구가 수행되어 데이터베이스에 포함시킬 것이다.
A part of this paper was presented and selected as one of best papers at the KSNVE 2013 Annual Autumn Conference
Acknowledgements
이 논문은 2010년도 정부(지식경제부)의 재원으로 산업융합기반구축사업의 지원(No. 10037244) 및 2012년도 정부(교육과학기술부)의 재원으로 한국연구재단의 지원을 받아 수행된 연구임(No.2012-0000975).
BIO
Daehyuk Son, B.S. in KAIST, Mechanical Eng., 2011, M.S. in KAIST, Mechanical Eng., 2013, Ph.D. course 2013~Present, in Structural Dynamics and Applied Control Lab. Research interests are 3D sound technology, HRTF database, HRTF customization, signal processing and sound reproduction.
Youngjin Park, B.S. in Seoul National University, Mechanical Eng., 1980, M.S. in Seoul National University, Mechanical Eng., 1982., Ph.D. in University of Michigan, 1987, University of Michigan Research Fellow, 1987~ 1988., New Jersey Institute of Technology Assistant Professor, 1988~1990., KAIST Mechanical Eng. Professor, 1990~Present, in Structural Dynamics and Applied Control Lab. Research interests are automatic control, active and passive noise control, 3D sound technology, MR fluids, vehicle stability control, fault diagnosis, robust control and system identification.
References
Blauert J. 1983 Spatial Hearing : The Psychohysics of Human Sound Localization MIT Press
Kistler D. J. , Wightman F. L. 1992 A Model of Head-related Transfer Functions based on Principal Components Analysis and Minimum-phase Reconstruction J. Acoust. Soc. Am. 91 (3) 1637 - 1647    DOI : 10.1121/1.402444
Algazi V. R. , Duda R. O. , Thompson D. M. , Avendano C. 2001 The CIPIC HRTF Database IEEE Workshop on Applications of Signal Processing to Audio and Acoustics 2001 99 - 102
http://recherche.ircam.fr/equipes/salles/listen/
Grassi E. , Tulsi J. , Shamma S. 2003 Measurement of Head-related Transfer Functions based on the Empirical Transfer Function Estimate Proceedings of the 2003 International Conference on Auditory Display 119 - 122
http://www.ais.riec.tohoku.ac.jp/lab/db-hrtf/
Ju Y. W. 2012 Measurement System and Analysis of Korean Head-related Transfer Function, Mater's Thesis KAIST
Hwang S.-M. , Park Y.-J. , Park Y.-S. 2008 Comparison of Head-related Transfer Function Models Based on Principal Components Analysis Transactions of the Korean Society for Noise and Vibration Engineering 18 (6) 642 - 653    DOI : 10.5050/KSNVN.2008.18.6.642
Son D. H. , Park Y. J. , Park Y. S. , Jang S.-J. 2013 Building Korean Head-related Transfer Function Database Proceedings of the KSNVE Annual Autumn Conference 715 - 716
Ju Y. , Son D. , Park Y. , Lee S. 2012 Analysis of Korean Head-related Transfer Function Proceeding so ACOUSTICS 2012 HONG KONG