Advanced
Subjective Listening Test based on Frontal Loudspeaker Array Reproduction System
Subjective Listening Test based on Frontal Loudspeaker Array Reproduction System
Journal of Broadcast Engineering. 2015. Sep, 20(5): 667-675
Copyright © 2015, The Korean Society of Broadcast Engineers
  • Received : July 09, 2015
  • Accepted : September 16, 2015
  • Published : September 30, 2015
Download
PDF
e-PUB
PubReader
PPT
Export by style
Share
Article
Author
Metrics
Cited by
TagCloud
About the Authors
재현 유
jh0079@etri.re.kr
대영 장
태진 이

Abstract
고화질, 고품질 방송에 대한 관심이 크게 증가하면서 영상 신호 뿐만 아니라 음향 신호의 고품질화를 요구하는 목소리도 높아지고 있다. 음향 신호의 고품질화에 기여하는 요소 중 하나는 가령, 10.2채널, 22.2채널 등과 같은 재생 채널 수의 확장이지만 이는 많은 수의 스피커를 설치해야만 하는 문제점이 발생한다. 이와 같은 문제를 해결하기 위한 한 가지 방법으로 전방 스피커 어레이를 통한 입체 음향 재생 방식을 들 수 있는데 본 논문에서는 스피커 어레이 기반 음장 재생 방식인 음장합성 기술 (Wave Field Synthesis, WFS)에 대한 소개 및 이론적인 분석을 하고 이 기술로 구현한 전방 스피커 어레이 시스템의 입체 음향 재현 성능을 확인하기 위한 주관 청취 평가 결과를 제시한다. 결론적으로, WFS에 기반한 전방 스피커 어레이 재생 방식이 디스크리트 5.1채널 재생 방식과 비교하여 만족스러운 음장감을 제공한다는 것을 알 수 있었다.
Keywords
Ⅰ. 서 론
아날로그에서 디지털로 방송 환경이 변하면서 고화질, 고품질에 대한 시청자들의 관심도 점점 크게 증가하고 있다. 그로 인해 HDTV 서비스가 시작되었고, 또 최근에는 그보다 더 뛰어난 품질의 UHDTV 서비스도 개시를 앞두고 있다. TV 서비스의 영상 신호의 품질이 높아지면서, 마치 현장에 있는 듯한 실감 방송이 가능해졌다는 목소리가 높아졌다. 물론 고화질, 고품질이 실감 방송에 큰 기여를 하는 것은 사실이지만 영상 속 작은 움직임까지 포착하는 사운드가 기반이 되지 않는다면, 진정한 실감 방송이라고 단정하기는 어렵다. 영화 마니아들이 멀티채널 오디오 시스템 기반 홈시어터를 갖추어 몰입도를 높이려 하는 것도 바로 이 때문이다. 하지만 이와 같은 흐름에 장애가 되는 요소가 한 가지 있는데, 바로 많은 수의 스피커 설치에 대한 문제이다. 2채널 스테레오에서 5.1채널로 넘어가는 단계에서도 기존 2개에서 총 6개로 늘어난 스피커들을 어떻게 가정에 배치, 설치하는지에 대한 문제가 여전히 남아 있다. 또한 최근에는 5.1채널 이상의 멀티채널 포맷들도 많이 만들어지고 있어서 이와 같은 문제는 더욱 크게 부각이 된다.
이와 같은 문제를 해결하기 위한 한 가지 방법으로 어레이 재생 방식을 활용할 수 있을 것이다. 멀티채널 오디오를 재생하는 방식에는 디스크리트 재생 방식과 어레이 재생 방식이 있다. 디스크리트(Discrete) 재생 방식은 2채널 스테레오나 5.1채널 재생 포맷처럼 개별 스피커를 특정 위치에 배치하는 방식을 가리킨다. 어레이 재생 방식은 직선 혹은 곡선의 형태로 스피커 유닛을 연속으로 배치하여 재생하는 방식을 가리킨다. 최근 유행하는 사운드바도, 물론 해당하지 않는 경우도 존재하나, 넒은 범위의 어레이 재생 방식에 속한다고 볼 수 있다. 스피커 어레이를 구성하여 음향을 재생하는 방식은 특별한 재생 기술을 적용하여 전방에만 스피커 어레이를 배치하고도 서라운드 음향을 즐길 수 있다는 장점을 제공한다. 즉, 다시 말해, 앞서 언급한 디스크리트 재생 방식의 단점을 극복하면서 디스크리트 재생 방식에서 제공하는 입체 음향을 즐길 수 있다는 의미이다.
이에 본 논문에서는 전방 스피커 어레이 재생 방식을 분석, 기존의 멀티채널 콘텐츠인 5.1채널 콘텐츠를 재생할 때의 음상 정위 및 음장감에 대한 주관 평가를 실시한 결과를 소개하고자 한다.
본 논문의 구성은 다음과 같다. 2 장에서 어레이 재생 기술인 음장합성 기술 (Wave Field Synthesis, WFS)에 대한 이론적인 분석을 하고, 3 장에서 WFS에 기반한 음상 정위 실험 및 음장감 실험에 대해 기술하고, 4 장에서 본 논문에 대한 결론을 맺는다.
Ⅱ. 음장합성 기술 기반 스피커 어레이 재생 기술
음장합성은 1차 음원(소스 음원)에서 발생된 파형을 2차 음원(라우드스피커 어레이)를 이용하여 재현해내는 방식으로, 하나의 점음원에서 발생한 파면은 연속적이고 무한한 구형의 파면으로 합성이 가능하다는 호이겐스 원리에 기반 하여 물리적인 1차 음원 없이도 스피커 어레이 만으로 소스 음원을 재현해내는 방식이다. 스피커어레이로 재생되는 오디오 신호의 도출은 레일레이, 키르히호프-헬름홀츠 적분에 기반을 두고 있다 [1 , 2 , 3 , 4] .
PPT Slide
Lager Image
호이겐스 원리에 기반한 음장합성 기술 Fig. 1. WFS based on Huygens’ principle
보다 구체적으로 멀티채널 사운드를 음장합성으로 재생하는 방법은 다음과 같다. 임의의 모양의 2차 음원 등고선(contour) 관점에서 키르히호프-헬름홀츠 적분을 살펴보면 비동차 경계 조건에 대한 경계 영역 V에 대한 동차 파동방정식은 다음과 같다 [5] .
PPT Slide
Lager Image
여기에서,
PPT Slide
Lager Image
는 경계
PPT Slide
Lager Image
로 둘러싸인 경계 영역 V 내의 압력 장을,
PPT Slide
Lager Image
는 그린 함수,
PPT Slide
Lager Image
는 경계
PPT Slide
Lager Image
에서의 음압 그리고
PPT Slide
Lager Image
는 ∂ V 내부로 향하는 노멀 벡터를 의미한다. 또,
PPT Slide
Lager Image
는 공간 상에서 노멀 벡터
PPT Slide
Lager Image
방향의 기울기를 나타내며, 키르히호프-헬름홀츠 적분에 사용되는 공간 구조는 아래 그림과 같다.
PPT Slide
Lager Image
키르히호프-헬름홀츠 적분에 사용되는 공간 구조 Fig. 2. geometry used for the Kirchhoff-Helmholtz integral
어레이를 구성하는 개별 스피커들을 단극성으로 볼 수 있기 때문에 상기 수식은 양극성을 없애고 적합하게 선택한 창 함수
PPT Slide
Lager Image
PPT Slide
Lager Image
이 수식에서의 그린 함수는 2차 음원의 장을 규정하며 남은 인자들은 그 세기를 정의한다.
PPT Slide
Lager Image
여기에서
PPT Slide
Lager Image
는 시간 평균 음향 세기 벡터를 의미한다.
세기는 2차 음원 구동 함수
PPT Slide
Lager Image
로서 나타내어진다.
PPT Slide
Lager Image
PPT Slide
Lager Image
는 V 안의 가상 음원의 파장을 의미한다.
평면파(plane wave)의 파장은 다음과 같이 주어지는데
PPT Slide
Lager Image
여기에서
PPT Slide
Lager Image
는 평면파의 진행 방향를,
PPT Slide
Lager Image
는 그 스펙트럼을 나타낸다.
그리고 구형파(spherical wave)의 파장은 다음과 같이 주어지는데
PPT Slide
Lager Image
여기에서
PPT Slide
Lager Image
는 구형파의 중심 위치를 나타내고,
PPT Slide
Lager Image
는 방사 방향으로의 스펙트럼을 의미한다.
따라서 평면파에서는, 수식 (4) 구동 함수의 주파수 도메인과 시간 도메인은 다음과 같이 나타낼 수 있다.
PPT Slide
Lager Image
PPT Slide
Lager Image
또, 구형파에서는, 주파수 도메인과 시간 도메인 구동 함수를 아래와 같이 각각 나타낼 수 있다 [6] .
PPT Slide
Lager Image
PPT Slide
Lager Image
PPT Slide
Lager Image
이 수식들은 t를 –t로 치환하는 시간 성분 변형을 통하여 집중 음원(focused source) 재생 [7] 에도 사용된다. 보통의 음장합성 기술이 청취 영역 외부에 음상이 놓이는데 반하여, 집중 음원은 청취 공간 내부 음상 정위가 필요할 때 활용할 수 있는 렌더링 방식이다.
상기의수식은 3차원 공간상에서의 2차 음원구동 함수를 도출한 것으로, 스피커 유닛을 일직선 상으로 배치하게 되는 스피커 어레이 환경에서는 구형파의 주파수 도메인과 시간 도메인 구동 함수를 다음과 같은 수식으로 사용하고 있다 [6] .
PPT Slide
Lager Image
여기에서 ωSW 는 모든 weighting factor를 포함함을 의미하며 pre-filter fSW ( t )는 inverse Fourier transformation F -1 를 통해 다음과 같이 정의된다.
PPT Slide
Lager Image
평면파에 대한 구동 신호는 pre-filtering된 음원 신호에 대한 가중치 부여와 시간 지연을 통해 얻어낼 수 있다.
III. 전방 스피커 어레이 재생 방식의 주관 청취 평가
전방 스피커 어레이 재생 방식을 디스크리트 재생 방식과 비교하기 위하여 청취평가를 진행하였다. 평가 항목은 전방 음상 정위력과 5.1채널 음원의 음장감 재생 성능이다.
PPT Slide
Lager Image
16채널 스피커 어레이 구성 Fig. 3. the configure of 16ch loudspeaker array
음상 정위 테스트를 위한 음원은 0.5초의 재생 시간을 가지는 핑크 노이즈를 0.5초의 무음 구간과 번갈아 총 13번 재생되는 핑크 노이즈 신호를 사용하였다. 음장감 테스트를 위해 각각 34초, 26초, 27초, 26초, 40초의 재생 시간을 가지는 자동차 음원(CAR)과 헬리콥터 음원(AIR), 숲속 음원(Nature), 빗소리 음원(Rain), 재즈음악(MUSIC) 음원을 사용하였으며 훈련된 오디오 전문가 9명이 실험에 참여하였다.
PPT Slide
Lager Image
실험 공간 구성 Fig. 4. the configure of listening room environment
실험 장치는 16채널의 어레이 시스템을 좌/우 측면과 후면에 반사판이 설치되어 있는 ETRI 음향 청취 실험실에 설치하였고 스피커 유닛의 사이즈는 5cm로 유닛 중심 간의 거리는 5.5cm이다. 청취자는 정중앙 청취점에 자리한다.
- 1. 전면 음상 정위 청취 평가 실험 설계 및 결과
전면 음상 재생 위치는 스피커 어레이 유닛 위치 기준으로 아래와 같이 16개 채널의 정중앙 부근과 한쪽 끝 및 1/4 지점 부근으로 음원의 위치 총 3군데를 선정하였다.
청취 평가 음원 정보Table 1. Information of sources
PPT Slide
Lager Image
청취 평가 음원 정보 Table 1. Information of sources
PPT Slide
Lager Image
어레이 상에서의 전면 음원의 표기 Fig. 5. frontal sound source on the loudspeaker array
총 3개의 음원은 유닛 하나로 재생되는 경우와 WFS로 렌더링된 경우, 2가지로 재생되어 청취 평가에 활용된다. 전술한 테스트 음원인, 핑크 노이즈 신호를 이용하여 얻은 총 3x2개의 음원은 Nuendo 멀티트랙 상에서 무작위로 재생, 청취자는 제시되는 음원을 듣고 표 4음상 정위 위치를 답지에 기입하도록 하였다. 실험결과의 객관성을 확보하기 위하여 각 음원은 방식별로 총 2번 재생하였다.
실험 결과는 아래와 같다.
전면 음상 정위는 레퍼런스 위치 대비 응답 위치의 각도 차이로 측정되는데, 그 방법은 아래와 같다. 즉, 레퍼런스의 측정 각도가 B라고 할 때 응답값의 측정 각도가 A라고 하면 두 각도 차이인 A-B를 음상 정위 오차로 판단하는 방식이다.
상기 표 2 3 을 통해서 알 수 있듯이, 전면 음상 정위력은 유닛 하나로 재생하는 경우와 WFS로 렌더링된 경우의 차이가 거의 발생하지 않는다. 오른쪽 끝 방향에 위치한 S2음원의 경우 유닛 재생과 WFS 재생 모두 응답 정확도가 떨어지는 결과를 보여주었으나 두 재생 방식에서의 차이가 미미한 것으로 보아 음상 정위 위치에 따른 경향성이라고 볼 수 있을 것이다. 왼쪽 끝 방향에 위치한 S1 음원과 가운데 위치한 S3 음원의 응답 정확도가 상당히 높다는 점이 그 근거가 될 수 있다.
전면 음상 정위 청취 평가 실험 결과 – 유닛 재생Table 2. result of frontal localization – unit reproduction
PPT Slide
Lager Image
전면 음상 정위 청취 평가 실험 결과 – 유닛 재생 Table 2. result of frontal localization – unit reproduction
전면 음상 정위 청취 평가 실험 결과 – WFS 렌더링Table 3. result of frontal localization – WFS rendering
PPT Slide
Lager Image
전면 음상 정위 청취 평가 실험 결과 – WFS 렌더링 Table 3. result of frontal localization – WFS rendering
PPT Slide
Lager Image
전면 음상 정위 각도 오차 측정 방법 Fig. 6. measurement of frontal localization error
- 2. 음장감 청취 평가 실험 설계 및 결과
음원은 5.1채널의 저주파 재생 채널인 LFE(Low Frequency Effect) 0.1채널을 제외한 5개 채널이 재생되는 환경을 기본으로 하였다. 5.1채널 비교군 재생을 위하여, 전방 3개 채널은 전방 스피커 어레이 내 가운데 유닛과 양 끝 유닛을 통해 L, C, R채널을 재생하며 청취 공간 내에 ±110˚ 위치에 LS, RS 스피커 유닛을 배치하였다. 5.1채널은 이런 환경에서 재생되는 경우와 전방 스피커 어레이만으로 입력 5.1채널에 대해 L, C, R 채널에 대한 WFS 렌더링 및 LS, RS 채널에 대한 집중 음원 렌더링으로 측후면 반사판에 반사되어 재생되는 경우를 블라인드로 청취 평가, 결과를 비교하게 된다.
5.1채널 콘텐츠는 아래 그림에서와 같이 전방과 후방의 스피커 배치 거리가 상이하여 전방 거리를 기준으로 후방 거리에 대한 차이를 보정 처리한 신호를 재생하였다. 실험실 내 일부 장비 설치와 같은 조건으로 인해 실험 환경의 좌, 우 대칭이 이루어지지 못했고 이와 같은 거리 차이를 보정 처리한 신호를 재생하였다.
전방 16채널 어레이 재생 환경 기준으로, 5.1채널 콘텐츠 렌더링을 수행하는데, 음원의 위치에 따라 다음과 같이 전방 채널은 WFS로, 서라운드 채널은 벽면 반사를 고려한 focused source 방식으로 신호 처리를 하였다.
PPT Slide
Lager Image
5.1채널 콘텐츠 재생 환경 구성 Fig. 7. the configure for reproduction of 5.1ch content
음장감 청취 평가 실험을 위한 렌더링 방식 조합Table 4. rendering scheme for envelopment listening test
PPT Slide
Lager Image
음장감 청취 평가 실험을 위한 렌더링 방식 조합 Table 4. rendering scheme for envelopment listening test
PPT Slide
Lager Image
WFS 콘텐츠 재생 환경 구성 Fig. 8. the configure for reproduction of WFS content
이와 같은 재생방법으로 자동차 음원(Car)과 헬리콥터 음원(Air), 숲속 음원(Nature), 빗소리 음원(Rain) 음원을 렌더링하여 Nuendo 멀티트랙 상에서 재생, 청취자는 제시되는 음원을 들으며 콘텐츠 속 특정 음원들이 느껴지는 방향을 기입하도록 했다. 음원이 도래하는 각 방향에 따라 가중치를 부여하여 해당 콘텐츠의 점수를 산출하게 되는데, 가령, 전방(Front, F)에서 음원이 느껴지면 1점, 측면(Side, S)에서 느껴지면 2점, 후면(Rear, R)에서 느껴지면 3점, 천정(Upper, U)에서 느껴지면 3점을 부여하며, F, S, R, U가 모두 존재하는 경우가 최대값 9점이 되는데 스피커에서 음원이 재생되므로 어느 방향에서든 소리가 느껴질 것이므로 0점이 나오는 경우는 없으므로 이 점수는 1~9점의 분포를 보이게 된다.
실험 결과는 아래와 같다.
음장감 청취 평가 실험 결과Table 5. result of envelopment test
PPT Slide
Lager Image
음장감 청취 평가 실험 결과 Table 5. result of envelopment test
콘텐츠 전체에 대한 평균값과, 콘텐츠 내 음상 이동이 있는 Car, Air 등의 “dynamic 콘텐츠”와 그렇지 않은 Nature, Rain 등의 “static 콘텐츠”로 구분한 평균값은 다음과 같다.
표 6 의 결과를 그래프로 나타내면 아래와 같다.
음장감 청취 평가 실험 결과 - 그룹별Table 6. result of envelopment test - grouping
PPT Slide
Lager Image
음장감 청취 평가 실험 결과 - 그룹별 Table 6. result of envelopment test - grouping
PPT Slide
Lager Image
음장감 청취 평가 실험 결과 Fig. 9. result of envelopment test
상기 표와 그래프로 나타낸 바와 같이 전체적인 음장감 재현에 있어서 개별 유닛을 사용한 5.1채널 재생 방식과 WFS 재생 방식이 거의 유사한 결과를 보여주었다. 음상의 이동이 발생하는 콘텐츠의 경우 개별 유닛이 존재하여 측후방 쪽에 좀 더 선명한 음상을 만들어줌으로써 5.1채널 재생 방식이 WFS 재생 방식보다 평균 응답값이 높았으나 95% 신뢰구간에서 겹치는 결과를 보여주었고, 음상 이동이 없는 콘텐츠의 경우 WFS 재생 방식이 보다 풍부한 음장감을 형성하여 5.1채널 재생 방식보다 평균 응답값이 높다는 것을 알 수 있었다. 전체적인 평균에서는 두 종류의 콘텐츠에서 거의 동일한 결과를 얻음으로써 WFS를 사용하는 스피커 어레이 기반 재생 방식이 디스크리트 5.1채널 재생방식과 비교하여 만족스러운 음장감을 제공한다는 것을 알 수 있었다.
IV. 결 론
본 논문에서는 디스크리트 멀티채널 재생 방식이 다수의 스피커를 설치해야 하는 현실적인 불편함으로 인하여 이를 대체하여 사용할 수 있는 전방 스피커 어레이 재생방식의 음향 재현 성능에 대해서 살펴보았다.
전술한 실험 및 결과를 통하여 알 수 있듯이, 전방 스피커 어레이의 전면 음상 정위력은 5.1채널 재생 방식과 같이 유닛 하나로 재생하는 경우와 어레이 상에 WFS로 렌더링된 경우의 차이가 거의 발생하지 않았고, 측후방 음원을 포함한 전체적인 음장감 재현에 있어서 개별 유닛을 사용한 5.1채널 재생 방식과 WFS 어레이 재생 방식이 거의 유사한 결과를 보여주었다. 다시 말해, WFS를 사용하는 스피커 어레이 기반 재생 방식이 디스크리트 5.1채널 재생 방식과 비교하여 만족스러운 음장감을 제공한다는 것을 알 수 있었다. 이를 통하여, 전방 스피커 어레이만으로도 디스크리트 재생 방식만큼의 멀티채널 음향 재생이 가능하다는 점을 확인할 수 있었다.
추후에는 선형 WFS 렌더링 방식에 최적화된 산술식에 기반하여 어레이를 구성하는 스피커 유닛의 개수를 다양하게 하고 청취 위치도 다양하게 하여 보다 정확한 전방 스피커 어레이 기반 재생 방식의 robust한 성능을 확인할 계획이다.
BIO
유 재 현
- 2003년 2월 : 홍익대학교 전자전기공학부 학사
- 2005년 2월 : 서울대학교 대학원 전기컴퓨터공학부 석사
- 2005년 2월 ~ 현재 : ETRI 오디오연구실 선임연구원
- 2011년 11월 ~ 2012년 11월 : 일본 NHK 방송기술연구소 방문연구원
- ORCID : http://orcid.org/0000-0002-9326-9353
- 주관심분야 : 3D 오디오 및 음장 재생 기술, 오디오 신호 처리
장 대 영
- 1991년 2월 : 부경대학교 전자공학과 (공학사)
- 2000년 2월 : 배재대학교 컴퓨터공학과 (공학석사)
- 2008년 2월 : 배재대학교 컴퓨터공학과 (공학박사)
- 2004년 10월 ~ 2005년 9월 : 일본 동경전기대학/DiMagic Co. Ltd. 방문연구원
- 1991년 1월 ~ 현재 : ETRI 오디오연구실 책임연구원
- ORCID: http://orcid.org/0000-0003-2572-4374
- 주관심분야 : 실감음향, 객체기반 오디오, 디지털 방송, 대화형 미디어
이 태 진
- 1996년 2월 : 전북대학교 전자공학과 (공학사)
- 1998년 2월 : 전북대학교 대학원 전자공학과 (공학석사)
- 2014년 2월 : 충남대학교 전자전파정보통신공학과 (공학박사)
- 1998년 2월 ~ 2000년 5월 : Mobens, Co., Ltd. 영상음성기술연구팀 연구원
- 2002년 10월 ~ 2003년 9월 : 일본 Tokyo Denki University, 방문연구원
- 2000년 5월 ~ 현재 : ETRI 오디오연구실장, 책임연구원
- ORCID: http://orcid.org/0000-0002-6067-511X
- 주관심분야 : 오디오 부호화, 실감음향, 오디오 신호처리
References
Berkhout A.J. , de Vries D. , Vogel P. 1993 “Acoustic Control by Wave Field Synthesis,” J. Acoust. Soc. Am. 93 (5) 2764 - 2778    DOI : 10.1121/1.405852
Verheijen E. , PhD Thesis 1998 “Sound Reproduction by Wave Field Synthesis,” TU Delft PhD Thesis
Theile G. “Wave Field Synthesis – A Promising Spatial Audio Rendering Concept,” Proc. 7th Int. Conf. Digital Audio Effects Oct. 2004 125 - 132
Chung H. J. 2012 “Sound Reproduction Method by Front Loudspeaker Array for Home Theater Applications,” IEEE Transactions on Consumer Electronics 58 (2)    DOI : 10.1109/TCE.2012.6227457
Williams E.G. 1999 Fourier Acoustics: Sound Radiation and Nearfield Acoustical Holography. Academic Press
Spors Sascha , Rabenstein Rudolf , Ahrens Jens “The Theory of Wave Field Synthesis,” AES 124th Convention Deutsche Telekom Laboratories, Germany 2008, May 17-20
Geier M. “Perceptual Evaluation of Focused Sources in Wave Field Synthesis,” AES 128th Convention Deutsche Telekom Laboratories, Germany 2010, May 22-25