Advanced
Channel-Divided Distributed Video Coding with Weighted-Adaptive Motion-Compensated Interpolation
Channel-Divided Distributed Video Coding with Weighted-Adaptive Motion-Compensated Interpolation
Journal of the Korea Institute of Information and Communication Engineering. 2014. Jul, 18(7): 1663-1670
Copyright © 2014, The Korea Institute of Information and Commucation Engineering
This is an Open Access article distributed under the terms of the Creative Commons Attribution Non-Commercial License(http://creativecommons.org/li-censes/by-nc/3.0/) which permits unrestricted non-commercial use, distribution, and reproduction in any medium, provided the original work is properly cited.
  • Received : March 06, 2014
  • Accepted : April 29, 2014
  • Published : July 31, 2014
Download
PDF
e-PUB
PubReader
PPT
Export by style
Share
Article
Author
Metrics
Cited by
TagCloud
About the Authors
진수 김
jskim67@hanbat.ac.kr

Abstract
초경량 비디오 부호화기에 대한 이론적인 근거를 제공하는 분산 비디오 부호화기법에 대한 연구가 활발히 진행되어 왔다. 그러나 기존에 많이 연구되어온 분산 비디오 부호화기법은 기존의 국제 표준의 비디오 부호화기에 비해 성능이 우수하지 못한 특징을 갖는다. 이러한 성능 제한을 극복하기 위해 복호기에서 보조정보를 생성하는 과정에서 얻어지는 정보를 이용하여 피드백하는 채널 분리형 분산 비디오 부호화기법에 대한 연구가 수행되었다. 본 논문에서는 복호기에서 보조정보를 생성하는 과정에서 적응적 가중치 기반의 움직임 보상 보간을 수행하고, 보상된 블록의 움직임 벡터 및 정합 특성을 분석하여 채널 분리하는 방법을 도입함으로써 효과적으로 채널을 구성 방안을 제안한다. 다수의 실험을 통하여 제안한 방법은 기존방식에 비해 낮은 비트율에서 우수한 성능을 보임과 동시에 일정한 화질을 제공할 수 있음을 보인다.
Keywords
I. 서 론
고속 신호처리 디바이스 및 장치 기술의 발전을 바탕으로 고압축의 비디오 기술이 국제 표준화되었고, 매우 다양한 응용분야에 적용되고 있다. 즉, MPEG-1/2/4, H.264, H.265 등의 국제 표준 동영상 압축 기술은 DTV/HDTV, UHDTV, VoD, 이동 모바일 멀티미디어 서비스 등 매우 많은 응용 분야에 활용되고 있다 [1 , 2] . 이러한 서비스는 고효율 및 고압축률이 제공되는 매우 복잡한 비디오 부호화기를 이용하여 제공되며, 불특정 다수에게 제공하는 상향링크 (uplink) 서비스 형태이다. 그러나 정보통신의 발달로 이동 통신 단말기의 보급이 보편화되면서 사용자 개개인이 콘텐츠를 만들고 이를 업로드 (upload)하는 형태의 하향링크 (downlink) 응용 서비스 즉, 이동 모바일 단말기, 무선 저전력 감시 카메라, 센서 네트워크 등의 응용 서비스에서는 저전력에 적합한 비디오 부호화기를 필요로 하고 있다. 저전력 환경에 적용하기 위해서는 부호화하여 전송하는데 복잡도가 낮아야 하고 매우 낮은 연산량을 갖는 초경량의 하드웨어로 구축되는 것이 요구된다 [3] . 이러한 초경량 비디오 부호화에 대한 기초 이론을 제공하는 기술이 분산 비디오 부호화 (DVC: Distributed Video Coding)이며, 이 기법은 기존의 부호화기에 필요한 복잡도를 부호화기와 복호기 사이에 적절히 분산시킬 수 있다는 것이 근본적인 원리이다. 분산 비디오 부호화 기법에서는 움직임 추정과 같이 연산량이 많이 필요한 부분을 복호기에서 수행함으로써 저전력 구현이 가능하다. 즉, 부호화기에서 보내려는 프레임을 위너-지브 (WZ: Wyner-Ziv) 프레임이라 하고, 복호기에서 WZ프레임과 매우 유사한 신호 성분을 즉, 보조정보 (SI: Side Information)를 생성함으로써 부호화 효율을 개선시킬 수 있는 것이다.
한편, 분산 비디오 부호화 방식에 대한 기존의 연구는 주로 코덱 구조 연구, 보조정보 생성 및 보정 기법 등과 같은 분야에 집중된 연구가 이루어졌다. 그러나 수많은 관심과 연구가 수행되었지만 현재까지 발표된 많은 연구 결과들은 기존의 국제 표준화된 동영상 압축기법에 비해 압축 효율 측면에서 뛰어나지 못한 결과를 보이고 있다. 이러한 결과는 코덱 구조의 특성, 보조정보의 불완전함 등에서 그 원인을 찾을 수 있으나 근본적인 원인은 기존의 국제 표준 동영상 압축 기법에 비해 다양한 부호화 모드를 제공하지 못함에 있다고 할 수 있다. 즉, 기존의 국제 표준 동영상 압축 기법에서는 스킵모드, 0의 줄길이 부호화 등과 같이 부호화 효율을 개선시킬 수 있는 반면에 분산 비디오 부호화에서는 생성된 보조정보 내에 가상채널잡음의 존재 유무에 상관없이 일정한 양의 비트를 제공해야 채널 복호화가 가능하기 때문에 부호화 효율을 개선하는데 한계가 있다. 따라서 기존의 국제 표준 동영상 압축 부호화 기법의 효과를 도입하고 또한, 성능 한계를 극복하기 위해 접근하여 연구되어 온 방식이 채널 분리형 분산 비디오 부호화 방식이다 [4 - 7] . [4] 에서는 대칭형 움직임 탐색방식에 의해 보조정보를 생성하는 과정에서 얻어진 시간적 정합 특성, 정합 후의 이웃 블록들과의 공간적 정합특성, 그리고 움직임 벡터에 의한 정합 특성을 구하고 각각에 대해 가중치를 곱하여 비용을 구하고 그 비용에 따라 가상 채널을 나누는 방법을 제안하였다. 이 방식은 채널 분할에 따른 블록 위치 정보를 부호화기에 피드백하는 방식을 사용한 것으로서 공간적인 정합 특성이 실제 영상의 화면 내 복잡도에 따라 크게 변화하는 경우에 성능이 저하되는 단점을 갖고 있다. 키 프레임과 WZ프레임의 인터리빙 방식을 도입하고, 블록 단위의 에러 은닉을 위해 그레이코드를 사용하여 비트 에러 예측율을 개선하면서 선택적으로 패리티 비트 요구를 하는 방식으로 채널 분리형 방식을 제시하였다. [5] 에서는 보조정보 생성과정에서 얻어지는 움직임 벡터를 부호화기측으로 전송하고 WZ프레임과 보조정보의 잔차신호에 대하여 적응적으로 양자화하는 방식으로 활용하였다. [6] 에서는 [4] 에서 사용된 3종류의 비용 측정함수를 고려하여 가상채널 잡음을 예측하고, 비용이 큰 블록에 대해 선택적으로 부호화하도록 움직임 벡터를 부호화기측으로 전송하는 방식을 사용하였다. 이 방식은 [4] 의 방식에 비해 성능이 개선되는 장점이 있으나 여전히 공간적 정합 비용의 부정확성에 따라 성능변화가 크다는 단점을 갖고 있다. [7] 에서는 미리 결정된 보조정보에 대한 움직임 벡터를 전송하고 이 정보에 기초하여 각 슬라이스에 대해 비트 에러율을 조사하고 그 비트 에러율에 기초하여 선택적으로 부호화하는 방법을 제안하였다. 그러나 이 방식은 부호화기측에서 비트 에러율을 결정하고 선택적으로 부호화하며, 그 결과를 복호기측으로 재전송해야 하는 점에서 복잡하고 부가적인 연산을 필요로 한다는 단점을 갖고 있다.
기존에 연구되어 온 채널 분리형 분산 비디오 부호화 기법은 부호화 효율을 개선하는 장점이 있으나 최적으로 채널을 분리하는 방식에 대한 연구는 부족하다. 이에 본 논문에서는 기존의 채널 분리형 분산 비디오 부호화 기법에서 복호기에서 효과적으로 채널을 분할하는 방식을 제안하고 성능을 분석한다. 제안한 방식은 기존의 시간적 정합척도, 공간적 정합척도, 그리고 움직임 벡터에 의한 정합 척도를 각각 독립적으로 수행하지 않고 통합적으로 처리함으로써 성능이 개선될 수 있음을 보인다. 이를 위한 본 논문의 구성은 다음과 같다. 제2절에서는 [4] [6] 에서 다루어진 채널 분리형 분산 비디오 부호화와 잔차 신호에 적합한 코덱 구조 [7] 를 설명한다. 그리고 제3절에서는 본 논문에서 제안된 적응적 가중치 기반의 움직임 보상 보간에 기초한 채널 분리형 분산 비디오 부호화 기법을 제안한다. 제4절에서 는 모의실험을 통하여 제안 방식의 성능을 검증하고 끝으로 제5절에서는 결론을 맺는다.
II. 채널 분리형 분산 비디오 코덱
- 2.1. 채널 분리형 분산 비디오의 기본 개념
그림 1 은 대표적인 채널 분리형 분산 비디오 코덱이다. 분산 비디오 부호화는 보조정보를 수신측에서 생성하고, 보조정보에 포함된 가상채널 잡음을 제거하기 위해 송신측에서 WZ프레임 정보로 생성된 패리티 정보를 전송함으로써 부호화 효율을 얻게 된다. 이때 보조정보에 포함된 가상채널잡음의 양이 많으면 많을수록 많은 패리티 비트량을 필요로 한다. 반면에 가상채널잡음이 없더라도 일정량의 패리티 정보는 수신측으로 전송되어 프레임 복원에 활용된다. 가상채널잡음이 없거나 매우 미미한 경우에도 패리티 비트를 전송하는 것은 부호화 효율을 떨어뜨리는 주된 원인이 되게 된다. 따라서 이와 같이 가상채널잡음이 낮은 경우와 높은 경우로 각각 나누어 패리티 비트 요구량을 달리하도록 하는 것이 채널 분리형 분산 비디오 부호화의 개념이다 [4 - 7] . 그림 1 에서 나타낸 바와 같이 보조정보를 생성하는 과정에서 가상채널잡음의 양을 예측하고, 예측된 가상 채널 잡음의 양에 기초하여 블록 기준으로 2개 이상의 다수 채널로 분리하여 부호화기 측에 채널정보 및 블록 위치 정보를 전송함으로써 부호화 효율을 개선하게 된다.
PPT Slide
Lager Image
복호기에서 보조정보 생성에 따른 채널분리를 갖는 분산비디오코덱 [4] Fig. 1 Block diagram for channel-divided distributed video codec [4]
- 2.2. 채널 분리를 위한 비용 함수
보조정보생성을 위해서 블록단위의 대칭형 탐색 [4] , 물체중심 탐색, 그리고 움직임 벡터 필드 탐색 등의 다양한 방법이 제시되었다. 실제 채널 분리형 분산 비디오 코덱에서는 블록단위의 대칭형 탐색 기법이 구현 측면에서 쉽고 용이하여 많이 고려되고 사용되었다 [4 - 6] . 블록 단위의 대칭형 탐색은 복원된 키 프레임을 참조 프레임으로 하여 양방향 선형적인 탐색에 기초한다. 즉, 양방향 탐색은 이전 참조 프레임에서 이후 참조 프레임에 대하여 차이 절대 값의 합과 이후 참조 프레임에서 이전 참조 프레임으로의 차이 절대 값의 합이 최소가 되는 위치를 교정된 움직임 벡터로 하며 다음과 같이 표현된다.
PPT Slide
Lager Image
여기서, p는 주어진 탐색을 하고자 하는 블록 M에 속하는 화소의 좌표를 나타내고, x n−1 x n+1 는 이전 참조 프레임과 이후 참조 프레임을 각각 나타낸다. [4] 에 나타낸 방식으로 주위 블록들과의 움직임 벡터에 대한 잡음을 제거한 후에 얻어지는 움직임 벡터( vw )를 이용하여 n번째 프레임의 주어진 블록은 다음과 같은 방식으로 보조정보가 생성된다.
PPT Slide
Lager Image
채널 분리를 위해서는 생성된 보조정보에 대해 정합된 특성을 분석하기 위해서는 각 구성 블록에 대해 정합 특성에 대한 평가지표로서 비용함수가 사용된다. [4] 에 사용된 3가지 비용함수는 시간적 정합 비용( Ct ), 공간적 정합 비용( Cs ), 움직임 벡터의 균일성( Cm )으로 나뉘며, 다음과 같다.
PPT Slide
Lager Image
시간적 정합 비용함수는 식 (2)에 나타낸 순방향 예측 블록과 역방향 예측 블록의 차이를 이용하여 측정한다. 여기서 NA 는 현재 프레임의 주어진 화소 블록 M에 속하는 화소의 개수를 나타낸다. 공간 정합 비용함수는 현재 보간된 블록과 주위 블록이 상호 인접한 화소들 사이의 연결의 자연스러움을 측정하는 것으로서 객체의 복잡도에 의존한다. Ms는 주어진 블록의 경계에 있는 화소 그룹이고, Ns는 Ms에 포함된 화소개수를 나타내며, B(p)는 화소 위치 p에 접해있는 주위 블록에 속하는 화소 위치를 나타낸다. 그리고 움직임 벡터의 균일성은 현재 블록의 움직임 벡터를 이웃하는 블록의 움직임 벡터들과의 최소 차이 값을 측정된다. s는 주어진 블록과 이웃하는 블록들에 대한 움직임 벡터 집합을 나타낸다.
III. 적응적 가중치 기반의 움직임 보상을 이용한 채널 분리형 기법
- 3.1. 제안된 채널 분리형 분산비디오 코덱 구조
그림 2 는 본 논문에서 제안된 채널 분리형 분산 비디오 코덱의 구조를 나타내며, 보조정보 생성과 채널 분리 방식을 제외하고 기본적인 동작 방식은 [8] 의 결과에 기초하고 있다. 제안된 코덱 구조는 라플라시안 분포를 따르는 잔차 신호에 대해 적용된다. 즉, 통계 분포특성인 0을 중심으로 대칭적인 구조를 가지므로, 이를 효과적으로 부호화하기 위해 잔차 신호에 대해 치환 연산을 수행한다. n비트의 밝기 값으로 표현되면, 밝기 차이 값(r)의 범위는 −2 n +1에서 부터 2 n +1까지의 값을 가지게 되며, 최상위 중요 상위 비트가 가상채널잡음이 자주 발생하지 않도록 하기 위해 다음과 같이 양수의 값(P)으로 치환한다.
PPT Slide
Lager Image
PPT Slide
Lager Image
제안된 채널 분리형 분산 비디오 코덱 구조도 Fig. 2 Block diagram for proposed channel-divided distributed video codec
여기서 T는 양자화 깊이 값에 의해 결정되는 치환이동 값이고, %는 모듈로 연산자이다. 이 식에서 P의 값은 (n+1)비트로 표현되며 (n+1)비트 중에서 하위 m개의 비트는 비트 버림으로 전송을 하지 않고, 상위(n+1−m)개의 비트만 전송한다. 가상채널 잡음을 줄이면서 효과적인 전송을 위해 (n+1−m)개의 상위 비트는 그레이 코드로 변환되어 전송한다.
복호기에서는 프레임 메모리에 저장된 복원된 키프레임의 정보를 활용하여 3.2절에서 설명될 적응적 가중치 기반의 움직임 추정에 의해 보조정보 를 생성한다. 생성된 보조정보는 송신측에서 (n+1−m)비트 개수만큼의 비트 플레인으로 전송되는 프레임을 위해 부호화기와 반대의 과정으로 복원된다. 즉, (4)의 과정이 보조정보에 대해 적용되고, 그레이코드로 변환 후 상위 비트 플레인의 그레이코드가 순차적으로 수신되면, 가상채널잡음이 보정되고, 보정된 코드는 다시 그레이코드에서 이진코드로 변환된다.
전송되지 않은 m비트에 대한 정보와의 왜곡을 최소화하기 위해 보조정보와 비교하여 선택하도록 한다. 복원된 (n+1)비트의 값
PPT Slide
Lager Image
는 다음의 관계식을 이용하여 잔차 신호를 얻는다.
PPT Slide
Lager Image
여기서
PPT Slide
Lager Image
는 (5)에 대한 복원된 값이며, 이 값에 프레임 메모리에 있는 키 프레임을 더하여 복원한다.
- 3.2. 적응적 가중치 기반의 움직임 보상을 이용한 채널 분리 방식
본 논문에서는 [4] 에서 제안한 방식과 같이 양방향대칭형으로 움직임을 탐색하여 식 (1)과 (2)을 이용하여 보조정보를 생성한다. 이때, 예측된 최종 움직임 벡터( vw )가 부정확하다면, 생성된 보조정보에는 블록화 효과 (blocking effect)가 나타나 크게 화질 저하가 초래될 수 있다. 따라서 움직임 벡터의 정확도를 예측하여 화질을 간접적으로 평가할 수 있으며 본 논문에서는 [9] 의 연구 결과를 변형하여 식 (2)의 보간 방식에 따라 정확도 함수를 다음과 같이 정의한다.
PPT Slide
Lager Image
여기서 정확도는 식 (3)에서 시간정합 결과에 반비례하는 특성을 갖게 나오므로 Ai ( vw ) 의 값이 크게 나올수록 정확도가 높고 화질이 우수하다고 할 수 있다. 이 값을 주위 블록들이 갖는 정확도 함수의 가중치 기반으로 더하면 식 (2)는 다음과 같이 구해진다.
PPT Slide
Lager Image
여기서 i (0 ≤ i L )는 현재의 블록과 인접한 이웃블록들의 인덱스를 나타내고, L은 인접 이웃 블록의 개수를 나타낸다. 식 (7)의 계산식에서 큰 값의 가중치는 영향력이 크게 미치는 것이고, 그렇지 않으면 영향력이 낮게 된다. 가중치 기반으로 주위 블록을 중복시킴으로서 블러링 (blurring)과 같은 화질 저하는 발생될 수 있다. 즉 움직임이 없는 블록이거나 움직임이 있는 단일객체로 이루어진 경우에는 블러링에 의해 화질 저하가 발생될 수 있다. 반면에, 주로 블록의 경계에서 발생되는 블록화 효과는 움직임 벡터장에서 전경 (foreground)과 배경(background)의 움직임이 다른 경우에 야기된다. 따라서 식 (7)에 의한 가중치 기반의 움직임 보상은 움직임이 없거나 단일 객체로 이루어진 블록에 대해서 는 수행하지 않는 것이 필요하다. 이를 위해 본 논문에서는 [9] 에서 고려된 방식을 도입하여 적응적으로 적용한다. 움직임 벡터의 오차는 움직임, 기울기 그리고 양자화 잡음 등에 의해 영향을 받는다고 가정하고 양방향대칭형에 의해 움직임 탐색이 이루어질 때, 두 블록간의 움직임 오차는 문턱치(λ T ) 보다 작다. 이러한 가정에 따라 [9] 의 방식에 따라 적응적 문턱치는 다음과 같이 결정한다.
PPT Slide
Lager Image
여기서, 𝜖는 평균적인 잡음을 반영한 상수이고, λ G ( v ) 는 다음과 같이 결정한다.
PPT Slide
Lager Image
여기서 d =[1,1] t 로서 t는 전치(transpose)를 의미한다. 식 (9)은 n번째 프레임의 현 위치와 인접한 화소 위치에 의해 결정되는 움직임 보상 오차의 크기를 측정해서 움직임 벡터의 균질성을 측정함으로서 식 (8)에 의해 예측된 움직임 벡터가 결정된다. 움직임 벡터의 오차 λ( v ) 는 제로 움직임 벡터 λ T (0) 와 예측 움직임 벡터 λ T ( v ) 과 비교하여 식 (7)의 적용 여부와 더불어 채널분리 방식을 다음과 같은 규칙에 의해 결정한다.
  • i). λ(v) 의 값이 λT(0)와 λT(v) 에 비해 작으면 이것은 움직임이 없는 블록이고 움직임 벡터가 정확하다는 것을 의미하므로, 식 (7)이 적용되지 않는다.
  • ii). λ(v) 의 값이 λT(0)보다 작고, λT(v)에 비해 작지 않으면 이것은 움직임이 없는 블록이지만, 크기 관계가 예측한 것과 일치하지 않아 불안정한 블록임을 의미한다.
  • iii). λ(v) 의 값이 λT(0) 보다 작지 않고, λT(v) 에 비해 작다면, 이것은 움직임이 있고 움직임이 있는 전역 움직임 벡터임을 의미여, 식 (7)을 적용하지 않는다.
  • iv). λ(v) 의 값이 λT(0)과 λT(v)에 비해 작지 않다면, 움직임이 모호하거나 변형 가능한 영역임을 의미한다.
이상의 분석을 통하여 iv)와 ii)에 대해 식 (7)을 적용한다. 그리고 그림 2에 나타낸 코덱 구조에서 본 논문에서는 iv)의 경우에 대해 먼저 블록을 단일 채널로 구성하고, 그리고 ii)의 조건에 맞는 블록을 추가 채널을 구성하여 채널 구성 정보를 부호화기 측으로 전송하도록 구성한다. 이때, iv)에 의한 영역이 없는 경우에는 ii)의 조건만으로 채널을 구성하도록 제어한다.
IV. 모의실험 및 결과 검토
제안된 방식의 유효성을 검증하기 위해 모의실험을 수행하였다. 먼저 채널 분리를 위한 블록 선택에 대한 타당성 검증을 위해 블록화 효과가 발생될 수 있는 영역 및 불안정한 움직임 블록을 조사하였고, 그 결과를 그림 3 에 나타내었다. 이 실험 결과에서 알 수 있듯이 비선형움직임이 있는 물체의 블록 에지 영역이 주로 선택되었다. 이것은 전경과 배경이 단일 움직임 벡터로 표현될 수 없거나 또는 움직임이 없더라도 실제의 움직임 벡터를 표현할 수 없는 경우로 볼 수 있다.
PPT Slide
Lager Image
채널 분리를 위한 불명확한 블록 영역 (Kendo) Fig. 3 Unidentified blocks for channel division (Kendo)
그리고 제안 방식에 의한 채널 분리 방식이 실제 채널 구성에서 의미가 있는지를 알아보기 위해 모의실험을 수행하였다. 모의실험에는 Foreman과 Salesman 시퀀스 (QCIF, 30Hz, 101개 프레임)를 사용하였다. 홀수 프레임은 H.264 화면내 부호화 방식으로 양자화 파라미터를 25로 고정시키고, 부호화 및 복호화 과정을 수행하고 복원된 결과를 프레임 메모리에 저장하였다. 이 복원된 프레임을 사용하여 짝수 번째 프레임에 대해 적응적 가중치 기반의 움직임 보상 보간을 수행하고, 블록화 효과를 갖는 블록을 제안된 방식으로 찾아낸 후에 3.2절에서 설명한 방법에서 iv)에 해당되는 블록들에 대해 시간적 정합비용 크기순으로 정렬하였다. 이때 크기 순으로 채널 구성을 위해 블록을 선택하였을 때, 실제의 해당 짝수 프레임과 비교하였을 때, 그 채널 구성과 동일할 확률을 조사하여 그림 4 에 나타내었다.
PPT Slide
Lager Image
선택 블록 개수에 따른 통계적인 확률 (a) Foreman (b) Salesman Fig. 4 Statistical probability of the number of selected blocks (a) Foreman (b) Salesman
즉, 채널 분리 방식을 구성하기 위해 필요한 선택 개수 만큼의 블록을 선택하였을 때, 그 정렬된 블록들이 실제 프레임의 왜곡 순으로 정렬을 위해 포함되어질 확률을 표시한 것이다. 비교를 위해 식 (3)에 나타낸 세 가지 비용을 결합한 Park [4] 방식과 시간정합 [6] 방식을 사용하여 비교하였다.
그림 4 에 나타낸 모의실험 결과에서 Foreman시퀀스의 경우에는 처음 10개의 블록까지는 제안방식과 Park [4] 방식은 매우 유사한 성능을 보이고 있으나 이후 블록들은 성능이 다소 우수한 성능을 보인다. 확률적으로 제안 방식이 안정된 성능을 보이고 있음을 확인할 수 있다. Salesman 시퀀스의 경우에는 전체적으로 배경이 복잡하지만 움직임이 많지 않은 시퀀스의 특성에 의해 선택된 블록의 개수가 15개 미만일 때까지 세 가지 방식이 거의 유사한 성능을 보인다. 이것은 움직임 블록과 그렇지 않은 블록의 특성이 명확하게 구분됨에 따라 채널 분리 특성에 있어 차이가 없음을 알 수 있다. 그러나 채널 구성을 위한 블록의 개수가 증가함에 따라 제안 방식이 매우 안정적으로 동작함을 간접적으로 나타낸다고 할 수 있다.
채널 분리형 분산 비디오 부호화 코덱에 적용하여 비트율-왜곡 특성에 대해 모의실험을 수행한 결과를 나타낸 것이 그림 5 에 나타내고 있다. 비트율 제어는 화면내 부호화에 사용되는 양자화 파라미터 값과 채널 분리비율을 사용하여 제어하였다. Park [4] 방식은 일정 비율로 나누는 방식을 사용하도록 되어 있어 실제 식 (3)의 결합에 의해 상위 50% 블록을 부호화기로 피드백하는 방식을 사용하였다.
제안한 방식은 3.2절에 나타낸 두 가지 형태 블록의 선택방식을 고려하였다. 또한 비교를 위해 DISCOVER 코덱에 의한 모의실험 결과를 얻어 나타내었다. 앞서 사용한 Foreman시퀀스와 Salesman시퀀스에 대해 그림 5 에 나타낸 모의실험 결과에 대해 제안 방식은 비트율일 300kbps이상에서는 기존 방식과 비슷한 결과를 보였으나, 비트율이 낮은 영역에서 우수한 성능을 발휘함을 알 수 있다. 특히 채널 전송률이 250 kbps에서 성능을 보이고, 그 이상에서채널 분리 방식이 따른 성능 차이가 다소 완화된 특성으로 나타남을 알 수 있다. 제안한 방식은 기존의 Park [4] 방식에 비해 최대 0.5dB 정도의 화질 개선을 달성할 수 있다. 따라서 제안한 방식은 기존의 방식에 비해 낮은 비트율을 이용하는 경우에 비트율-왜곡 측면에서 성능 개선이 우수하여 낮은 비트율 응용에 적합하다고 볼 수 있다. 그리고 DISCOVER와 같이 채널 분리형 분산 비디오 코덱이 아닌 경우에 비해 우수한 성능을 보이며, 거의 동일한 비트율에서 1.5 dB이상의 객관적인 화질 개선이 이루어짐을 알 수 있다. 이와 같은 특성은 채널 분리를 위한 블록 선택 방식에 있어서 본 논문에서 제안한 방식이 성능 개선에 기여함을 의미한다.
PPT Slide
Lager Image
모의실험에 의한 비트율-PSNR 성능 비교 (a) Foreman (b) Salesman Fig. 5 Performance comparison between bit-rate and PSNR (a) Foreman (b) Salesman
V. 결 론
본 논문에서는 채널 분리형 분산 비디오 부호화 기법의 성능 개선 방안으로 적응적 가중치 기반의 움직임 보상 보간에 의한 움직임 벡터의 분석을 통하여 움직임 벡터가 균질성을 갖지 않는 블록을 찾아서 채널분리를 수행하고 그 블록 정보를 부호화기에 전송하여 부호화 효율을 개선하는 알고리즘을 제안하였다. 제안한 방식은 모의실험을 통하여 실제 기존의 방식에 비해 왜곡이 큰 블록 중심으로 채널 구성을 용이하게 해주는 것을 확인하였고 더불어 채널 분리형 분산 비디오 코덱에 적용하여 상대적으로 우수한 비트율-화질 특성을 제공할 수 있음을 보였다. 특히, 250 kbps와 같이 매우 낮은 비트율에서 우수한 성능을 보였다. 이러한 모의실험을 통해 본 논문에서 제안한 방식은 움직임 벡터의 분석과 더불어 시간적 정합 특성을 동시에 고려함으로써 기존의 방식에 비해 안정되고 효율성이 우수함을 확인할 수 있었다.
본 논문에서 제안한 방식은 채널 구성에 있어 좀 더 가변적이고 다양한 제어 방식이 개발될 필요가 있다. 또한 전송채널의 비트율이 가변적인 경우에 비트율-왜곡의 최적화에 효과적으로 적용될 수 있을 것으로 기대되며, 다시점 비디오 부호화에도 활용 방법에 대한 추가적인 연구가 진행될 필요가 있다.
Acknowledgements
본 연구는 교육부와 한국연구재단의 지역혁신인력양성사업(No.2012H1B8A2025982) 및 2013년도 정부(교육부)의 재원으로 한국연구재단의 지원을 받아 수행된 연구임. (No.2012-0007680)
BIO
김진수(Jin-soo Kim)
1998년 : KAIST 전기 및 전자공학과 공학박사
1995년 ~ 2000년 : 삼성전자 선임연구원
2000년 ~ 현재 : 한밭대학교 정보통신공학과 교수
2003년 ~ 2006년 : 한국전자통신연구원 초빙연구원
2008년 ~ 2009년 : 텍사스 주립대학교(UTA) 교환교수
※관심분야 : Distributed Video Coding, 디지털방송, 영상부호화, 영상통신
References
2003 ISO/IEC International Standard 14496-10:2003, “Information Technology ? Coding of Audio-visual Objects : part10: advanced video coding”
Sullivan G. J. , Ohm J. , Han W. , Wiegand T. 2012 "Overview of the High Efficiency Video Coding (HEVC) Standard," IEEE Tr. on CSVT 22 (12) 1649 - 1668
Dufaux F. , Gao W. , Tubaro S. , Vetro A. 2010 "Distributed Video Coding: Trends and Perspectives" EURASIP Jour. Image Video Process 1 - 13
Park S.-U. , Choi J.-W. , Kim C.-S. , Lee S.-U. , Kang J.-W. 2009 "Efficient Distributed Video Coding Using Symmetric Motion Estimation and Channel Division&" PACRIM09
Min K-Y , Park S-N , Nam J-H , Sim D-G , Kim S-H 2010 “Distributed Video Coding based on Adaptive Block Quantization Using Received Motion Vectors," Jour. of KICS 35 (2) 172 - 181
Kim J-s , Kim J-G , Seo K-d 2011 “A Selective Block Encoding Based on Motion Information Feedback in Distributed Video Coding,” IEICE Trans. on Comm. E94-B (3) 860 - 862    DOI : 10.1587/transcom.E94.B.860
Min K-Y , Sim D-G 2013 "Adaptive Distributed Video Coding with Motion Vectors Through a Back Channel" EURASIP Journals on Image & Video Processing
Kim J-s , Kim J-G , Choi H , Seo K-d 2013 “Pixel-domain Wyner-Ziv residual video coder with adaptive binaryto- Gray code converting process,” IET Electronics Letters 49 (3) 189 - 190    DOI : 10.1049/el.2012.3362
Lee S-h , Kwon O. , Park R-h 2003 "Weighted-Adaptive Motion-Compensated Frame Rate Up-Conversion," IEEE Trans. on Consumer Electronics 49 (3)